Desafio: Codificação de Variáveis Categóricas
Para resumir os três capítulos anteriores, segue uma tabela mostrando qual codificador deve ser utilizado:
Neste desafio, utilize o conjunto de dados dos pinguins (sem valores ausentes). Todos os atributos categóricos — incluindo o alvo 'species' — devem ser codificados para uso em ML.
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Lembre-se de que 'island' e 'sex' são variáveis categóricas de características e 'species' é uma variável categórica de alvo.
Swipe to start coding
Você recebe um DataFrame df. Codifique todas as colunas categóricas:
- Importe
OneHotEncodereLabelEncoderdesklearn.preprocessing. - Separe os dados em
X(características) ey(alvo). - Crie um
OneHotEncodere aplique-o às colunas'island'e'sex'emX. - Substitua essas colunas originais por suas versões codificadas.
- Utilize o
LabelEncoderna coluna'species'para codificary.
Solução
Obrigado pelo seu feedback!
single
Pergunte à IA
Pergunte à IA
Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo
What are the steps to encode the categorical features and target in this dataset?
Can you explain the difference between OrdinalEncoder, OneHotEncoder, and LabelEncoder?
How do I choose which encoder to use for each column in the penguins dataset?
Awesome!
Completion rate improved to 3.13
Desafio: Codificação de Variáveis Categóricas
Deslize para mostrar o menu
Para resumir os três capítulos anteriores, segue uma tabela mostrando qual codificador deve ser utilizado:
Neste desafio, utilize o conjunto de dados dos pinguins (sem valores ausentes). Todos os atributos categóricos — incluindo o alvo 'species' — devem ser codificados para uso em ML.
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Lembre-se de que 'island' e 'sex' são variáveis categóricas de características e 'species' é uma variável categórica de alvo.
Swipe to start coding
Você recebe um DataFrame df. Codifique todas as colunas categóricas:
- Importe
OneHotEncodereLabelEncoderdesklearn.preprocessing. - Separe os dados em
X(características) ey(alvo). - Crie um
OneHotEncodere aplique-o às colunas'island'e'sex'emX. - Substitua essas colunas originais por suas versões codificadas.
- Utilize o
LabelEncoderna coluna'species'para codificary.
Solução
Obrigado pelo seu feedback!
single