Seção 4. Capítulo 10
single
Desafio: Integrando Tudo
Deslize para mostrar o menu
Neste desafio, aplicar o fluxo de trabalho completo aprendido no curso — desde o pré-processamento de dados até o treinamento e avaliação do modelo.
Tarefa
Deslize para começar a programar
Você está trabalhando com um conjunto de dados de pinguins. Construa um pipeline de ML para classificar espécies com KNN, lidando com codificação, valores ausentes, padronização e ajuste de hiperparâmetros.
- Codifique
ycomLabelEncoder. - Divida com
train_test_split(test_size=0.33). - Crie
ct:OneHotEncoderem'island','sex',remainder='passthrough'. - Defina
param_gridparan_neighbors,weights,p. Paran_neighbors, é melhor usar valores inteiros ímpares. - Crie
GridSearchCV(KNeighborsClassifier(), param_grid). - Pipeline:
ct→SimpleImputer('most_frequent')→StandardScaler→GridSearchCV. - Ajuste no conjunto de treino.
- Imprima o
.scoreno teste. - Realize previsões e imprima os primeiros 5 rótulos decodificados.
- Imprima o
.best_estimator_.
Solução
Tudo estava claro?
Obrigado pelo seu feedback!
Seção 4. Capítulo 10
single
Pergunte à IA
Pergunte à IA
Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo