Desafío: Comparación de Modelos
Ahora compararás los modelos que hemos cubierto utilizando un único conjunto de datos: el conjunto de datos de cáncer de mama. La variable objetivo es la columna 'diagnosis', donde 1 representa casos malignos y 0 representa casos benignos.
Aplicarás GridSearchCV a cada modelo para encontrar los mejores parámetros. En esta tarea, utilizarás recall como la métrica de evaluación porque minimizar los falsos negativos es fundamental. Para que GridSearchCV seleccione los mejores parámetros en función del recall, establece scoring='recall'.
Swipe to start coding
Se proporciona un conjunto de datos de cáncer de mama almacenado como un DataFrame en la variable df.
- Crear un diccionario para que
GridSearchCVitere sobre los valores[3, 5, 7, 12]paran_neighborsy guárdalo en la variableknn_params. - Crear un diccionario para que
GridSearchCVitere sobre los valores[0.1, 1, 10]paraCy guárdalo en la variablelr_params. - Crear un diccionario para que
GridSearchCVitere sobre los valores[2, 4, 6, 10]paramax_depthy[1, 2, 4, 7]paramin_samples_leaf, y guárdalo en la variabledt_params. - Crear un diccionario para que
GridSearchCVitere sobre los valores[2, 4, 6]paramax_depthy[20, 50, 100]paran_estimators, y guárdalo en la variablerf_params. - Inicializar y entrenar un objeto
GridSearchCVpara cada uno de los modelos, y almacenar los modelos entrenados en las variables respectivas:knn_grid,lr_grid,dt_gridyrf_grid.
Solución
¡Gracias por tus comentarios!
single
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla
Awesome!
Completion rate improved to 4.17
Desafío: Comparación de Modelos
Desliza para mostrar el menú
Ahora compararás los modelos que hemos cubierto utilizando un único conjunto de datos: el conjunto de datos de cáncer de mama. La variable objetivo es la columna 'diagnosis', donde 1 representa casos malignos y 0 representa casos benignos.
Aplicarás GridSearchCV a cada modelo para encontrar los mejores parámetros. En esta tarea, utilizarás recall como la métrica de evaluación porque minimizar los falsos negativos es fundamental. Para que GridSearchCV seleccione los mejores parámetros en función del recall, establece scoring='recall'.
Swipe to start coding
Se proporciona un conjunto de datos de cáncer de mama almacenado como un DataFrame en la variable df.
- Crear un diccionario para que
GridSearchCVitere sobre los valores[3, 5, 7, 12]paran_neighborsy guárdalo en la variableknn_params. - Crear un diccionario para que
GridSearchCVitere sobre los valores[0.1, 1, 10]paraCy guárdalo en la variablelr_params. - Crear un diccionario para que
GridSearchCVitere sobre los valores[2, 4, 6, 10]paramax_depthy[1, 2, 4, 7]paramin_samples_leaf, y guárdalo en la variabledt_params. - Crear un diccionario para que
GridSearchCVitere sobre los valores[2, 4, 6]paramax_depthy[20, 50, 100]paran_estimators, y guárdalo en la variablerf_params. - Inicializar y entrenar un objeto
GridSearchCVpara cada uno de los modelos, y almacenar los modelos entrenados en las variables respectivas:knn_grid,lr_grid,dt_gridyrf_grid.
Solución
¡Gracias por tus comentarios!
single