Desafio: Codificação de Variáveis Categóricas
Para resumir os três capítulos anteriores, segue uma tabela mostrando qual codificador deve ser utilizado:
Neste desafio, o conjunto de dados dos pinguins (sem valores ausentes) é fornecido. Todos os recursos categóricos, incluindo o alvo (coluna 'species'
), devem ser codificados.
Segue um lembrete da estrutura do conjunto de dados:
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Lembre-se de que 'island'
e 'sex'
são variáveis categóricas de características e 'species'
é uma variável categórica alvo.
Swipe to start coding
Codifique todas as variáveis categóricas. Utilize one-hot encoding para as colunas 'island'
e 'sex'
, e aplique um label encoder (ou codificador de alvo similar) para a coluna 'species'
. Siga estes passos para concluir a codificação.
- Importe
OnehotEncoder
eLabelEncoder
. - Inicialize o objeto codificador de variáveis.
- Codifique as colunas categóricas de variáveis utilizando o objeto
feature_enc
. - Inicialize o objeto codificador de alvo.
- Codifique o alvo utilizando o objeto
label_enc
.
Solução
Obrigado pelo seu feedback!
single
Pergunte à IA
Pergunte à IA
Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo
Which encoder should I use for each column in the penguins dataset?
Can you explain the difference between OrdinalEncoder, OneHotEncoder, and LabelEncoder?
What are the next steps to encode the categorical features and target in this dataset?
Awesome!
Completion rate improved to 3.13
Desafio: Codificação de Variáveis Categóricas
Deslize para mostrar o menu
Para resumir os três capítulos anteriores, segue uma tabela mostrando qual codificador deve ser utilizado:
Neste desafio, o conjunto de dados dos pinguins (sem valores ausentes) é fornecido. Todos os recursos categóricos, incluindo o alvo (coluna 'species'
), devem ser codificados.
Segue um lembrete da estrutura do conjunto de dados:
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Lembre-se de que 'island'
e 'sex'
são variáveis categóricas de características e 'species'
é uma variável categórica alvo.
Swipe to start coding
Codifique todas as variáveis categóricas. Utilize one-hot encoding para as colunas 'island'
e 'sex'
, e aplique um label encoder (ou codificador de alvo similar) para a coluna 'species'
. Siga estes passos para concluir a codificação.
- Importe
OnehotEncoder
eLabelEncoder
. - Inicialize o objeto codificador de variáveis.
- Codifique as colunas categóricas de variáveis utilizando o objeto
feature_enc
. - Inicialize o objeto codificador de alvo.
- Codifique o alvo utilizando o objeto
label_enc
.
Solução
Obrigado pelo seu feedback!
Awesome!
Completion rate improved to 3.13single