Sección 4. Capítulo 10
single
Desafío: Integrándolo Todo
Desliza para mostrar el menú
En este desafío, aplicar el flujo de trabajo completo aprendido en el curso: desde el preprocesamiento de datos hasta el entrenamiento y la evaluación del modelo.
Tarea
Desliza para comenzar a programar
Se trabaja con un conjunto de datos de pingüinos. Construir un pipeline de ML para clasificar especies utilizando KNN, gestionando la codificación, valores faltantes, escalado y ajuste de hiperparámetros.
- Codificar
yconLabelEncoder. - Dividir con
train_test_split(test_size=0.33). - Crear
ct:OneHotEncoderen'island','sex',remainder='passthrough'. - Definir
param_gridparan_neighbors,weights,p. Paran_neighborses preferible usar valores impares de enteros. - Crear
GridSearchCV(KNeighborsClassifier(), param_grid). - Pipeline:
ct→SimpleImputer('most_frequent')→StandardScaler→GridSearchCV. - Ajustar en el conjunto de entrenamiento.
- Imprimir el
.scoreen el conjunto de prueba. - Predecir e imprimir las primeras 5 etiquetas decodificadas.
- Imprimir
.best_estimator_.
Solución
¿Todo estuvo claro?
¡Gracias por tus comentarios!
Sección 4. Capítulo 10
single
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla