Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Alterando o Tipo de Dados | Breve Introdução
Pré-processamento de Dados
course content

Conteúdo do Curso

Pré-processamento de Dados

Pré-processamento de Dados

1. Breve Introdução
2. Processamento de Dados Quantitativos
3. Processamento de Dados Categóricos
4. Processamento de Dados de Séries Temporais
5. Engenharia de Recursos
6. Passando para as Tarefas

book
Alterando o Tipo de Dados

Você já sabe como alterar o tipo de dado de string para número, por exemplo. Mas vamos examinar com mais atenção essa tarefa pequena, porém importante.

Vamos começar mudando o tipo de dado de string para datetime. Na maioria das vezes, você precisará disso para trabalhar com séries temporais. Você pode realizar essa operação utilizando o método .to_datetime():

Para converter uma string para um bool, use o método .map() na coluna cujos valores você deseja alterar:

Por exemplo, se você possui uma coluna de preços que apresenta valores como "$198,800" e deseja convertê-los em float, você deverá criar funções personalizadas de transformação:

12345678910111213
import pandas as pd import re # Create simple dataset df = pd.DataFrame(data={'Price':['$4,122.94', '$1,002.3']}) # Create a custom function to transform data # x - value from column def price2int(x): return float(re.sub(r'[\$\,]', '', x)) # Use custom transformation on a column df['Price'] = df['Price'].apply(price2int)
copy
Tarefa
test

Swipe to show code editor

Leia o conjunto de dados sales_data_types.csv e altere o tipo de dado na coluna Active de str para bool.

Solução

Switch to desktopMude para o desktop para praticar no mundo realContinue de onde você está usando uma das opções abaixo
Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 1. Capítulo 5
toggle bottom row

book
Alterando o Tipo de Dados

Você já sabe como alterar o tipo de dado de string para número, por exemplo. Mas vamos examinar com mais atenção essa tarefa pequena, porém importante.

Vamos começar mudando o tipo de dado de string para datetime. Na maioria das vezes, você precisará disso para trabalhar com séries temporais. Você pode realizar essa operação utilizando o método .to_datetime():

Para converter uma string para um bool, use o método .map() na coluna cujos valores você deseja alterar:

Por exemplo, se você possui uma coluna de preços que apresenta valores como "$198,800" e deseja convertê-los em float, você deverá criar funções personalizadas de transformação:

12345678910111213
import pandas as pd import re # Create simple dataset df = pd.DataFrame(data={'Price':['$4,122.94', '$1,002.3']}) # Create a custom function to transform data # x - value from column def price2int(x): return float(re.sub(r'[\$\,]', '', x)) # Use custom transformation on a column df['Price'] = df['Price'].apply(price2int)
copy
Tarefa
test

Swipe to show code editor

Leia o conjunto de dados sales_data_types.csv e altere o tipo de dado na coluna Active de str para bool.

Solução

Switch to desktopMude para o desktop para praticar no mundo realContinue de onde você está usando uma das opções abaixo
Tudo estava claro?

Como podemos melhorá-lo?

Obrigado pelo seu feedback!

Seção 1. Capítulo 5
Switch to desktopMude para o desktop para praticar no mundo realContinue de onde você está usando uma das opções abaixo
We're sorry to hear that something went wrong. What happened?
some-alt