Desafío: Integrando Todo
En este desafío, aplica el flujo de trabajo completo aprendido en el curso: desde el preprocesamiento de datos hasta el entrenamiento y la evaluación del modelo.
Swipe to start coding
Estás trabajando con un conjunto de datos de pingüinos. Tu objetivo es construir un pipeline completo de aprendizaje automático que clasifique las especies de pingüinos utilizando un modelo de K-Nearest Neighbors (KNN). El pipeline debe gestionar la codificación de variables categóricas, valores faltantes, escalado de características y ajuste de parámetros.
- Codificar la variable objetivo
yutilizando la claseLabelEncoder. - Dividir el conjunto de datos en conjuntos de entrenamiento y prueba usando
train_test_split()contest_size=0.33. - Crear un
ColumnTransformerllamadoctque aplique unOneHotEncodera las columnas'island'y'sex', dejando las demás columnas sin cambios (remainder='passthrough'). - Definir una cuadrícula de parámetros
param_gridque contenga los siguientes valores paran_neighbors:[1, 3, 5, 7, 9, 12, 15, 20, 25], e incluir'weights'('uniform','distance') y'p'(1,2). - Crear un objeto
GridSearchCVutilizandoKNeighborsClassifier()como estimador yparam_gridcomo cuadrícula de parámetros. - Construir un pipeline que incluya los siguientes pasos en orden:
- El
ColumnTransformer(ct); - Un
SimpleImputercon la estrategia configurada en'most_frequent'; - Un
StandardScalerpara el escalado de características; - El objeto
GridSearchCVcomo paso final.
- Entrenar el pipeline con los datos de entrenamiento (
X_train,y_train) utilizando el método.fit(). - Evaluar el rendimiento del modelo imprimiendo el puntaje de prueba usando
.score(X_test, y_test). - Generar predicciones sobre los datos de prueba e imprimir los primeros 5 nombres de clases decodificados utilizando
label_enc.inverse_transform(). - Imprimir el mejor estimador encontrado por
GridSearchCVusando el atributo.best_estimator_.
Solución
¡Gracias por tus comentarios!
single
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla
Awesome!
Completion rate improved to 3.13
Desafío: Integrando Todo
Desliza para mostrar el menú
En este desafío, aplica el flujo de trabajo completo aprendido en el curso: desde el preprocesamiento de datos hasta el entrenamiento y la evaluación del modelo.
Swipe to start coding
Estás trabajando con un conjunto de datos de pingüinos. Tu objetivo es construir un pipeline completo de aprendizaje automático que clasifique las especies de pingüinos utilizando un modelo de K-Nearest Neighbors (KNN). El pipeline debe gestionar la codificación de variables categóricas, valores faltantes, escalado de características y ajuste de parámetros.
- Codificar la variable objetivo
yutilizando la claseLabelEncoder. - Dividir el conjunto de datos en conjuntos de entrenamiento y prueba usando
train_test_split()contest_size=0.33. - Crear un
ColumnTransformerllamadoctque aplique unOneHotEncodera las columnas'island'y'sex', dejando las demás columnas sin cambios (remainder='passthrough'). - Definir una cuadrícula de parámetros
param_gridque contenga los siguientes valores paran_neighbors:[1, 3, 5, 7, 9, 12, 15, 20, 25], e incluir'weights'('uniform','distance') y'p'(1,2). - Crear un objeto
GridSearchCVutilizandoKNeighborsClassifier()como estimador yparam_gridcomo cuadrícula de parámetros. - Construir un pipeline que incluya los siguientes pasos en orden:
- El
ColumnTransformer(ct); - Un
SimpleImputercon la estrategia configurada en'most_frequent'; - Un
StandardScalerpara el escalado de características; - El objeto
GridSearchCVcomo paso final.
- Entrenar el pipeline con los datos de entrenamiento (
X_train,y_train) utilizando el método.fit(). - Evaluar el rendimiento del modelo imprimiendo el puntaje de prueba usando
.score(X_test, y_test). - Generar predicciones sobre los datos de prueba e imprimir los primeros 5 nombres de clases decodificados utilizando
label_enc.inverse_transform(). - Imprimir el mejor estimador encontrado por
GridSearchCVusando el atributo.best_estimator_.
Solución
¡Gracias por tus comentarios!
single