Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Aprende Desafío: Comparación de Modelos | Comparación de Modelos
Clasificación con Python

bookDesafío: Comparación de Modelos

Ahora compararás los modelos que hemos cubierto utilizando un único conjunto de datos: el conjunto de datos de cáncer de mama. La variable objetivo es la columna 'diagnosis', donde 1 representa casos malignos y 0 representa casos benignos.

Aplicarás GridSearchCV a cada modelo para encontrar los mejores parámetros. En esta tarea, utilizarás recall como la métrica de evaluación porque minimizar los falsos negativos es fundamental. Para que GridSearchCV seleccione los mejores parámetros en función del recall, establece scoring='recall'.

Tarea

Swipe to start coding

Se proporciona un conjunto de datos de cáncer de mama almacenado como un DataFrame en la variable df.

  • Crear un diccionario para que GridSearchCV itere sobre los valores [3, 5, 7, 12] para n_neighbors y guárdalo en la variable knn_params.
  • Crear un diccionario para que GridSearchCV itere sobre los valores [0.1, 1, 10] para C y guárdalo en la variable lr_params.
  • Crear un diccionario para que GridSearchCV itere sobre los valores [2, 4, 6, 10] para max_depth y [1, 2, 4, 7] para min_samples_leaf, y guárdalo en la variable dt_params.
  • Crear un diccionario para que GridSearchCV itere sobre los valores [2, 4, 6] para max_depth y [20, 50, 100] para n_estimators, y guárdalo en la variable rf_params.
  • Inicializar y entrenar un objeto GridSearchCV para cada uno de los modelos, y almacenar los modelos entrenados en las variables respectivas: knn_grid, lr_grid, dt_grid y rf_grid.

Solución

¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 5. Capítulo 3
single

single

Pregunte a AI

expand

Pregunte a AI

ChatGPT

Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla

close

Awesome!

Completion rate improved to 4.17

bookDesafío: Comparación de Modelos

Desliza para mostrar el menú

Ahora compararás los modelos que hemos cubierto utilizando un único conjunto de datos: el conjunto de datos de cáncer de mama. La variable objetivo es la columna 'diagnosis', donde 1 representa casos malignos y 0 representa casos benignos.

Aplicarás GridSearchCV a cada modelo para encontrar los mejores parámetros. En esta tarea, utilizarás recall como la métrica de evaluación porque minimizar los falsos negativos es fundamental. Para que GridSearchCV seleccione los mejores parámetros en función del recall, establece scoring='recall'.

Tarea

Swipe to start coding

Se proporciona un conjunto de datos de cáncer de mama almacenado como un DataFrame en la variable df.

  • Crear un diccionario para que GridSearchCV itere sobre los valores [3, 5, 7, 12] para n_neighbors y guárdalo en la variable knn_params.
  • Crear un diccionario para que GridSearchCV itere sobre los valores [0.1, 1, 10] para C y guárdalo en la variable lr_params.
  • Crear un diccionario para que GridSearchCV itere sobre los valores [2, 4, 6, 10] para max_depth y [1, 2, 4, 7] para min_samples_leaf, y guárdalo en la variable dt_params.
  • Crear un diccionario para que GridSearchCV itere sobre los valores [2, 4, 6] para max_depth y [20, 50, 100] para n_estimators, y guárdalo en la variable rf_params.
  • Inicializar y entrenar un objeto GridSearchCV para cada uno de los modelos, y almacenar los modelos entrenados en las variables respectivas: knn_grid, lr_grid, dt_grid y rf_grid.

Solución

Switch to desktopCambia al escritorio para practicar en el mundo realContinúe desde donde se encuentra utilizando una de las siguientes opciones
¿Todo estuvo claro?

¿Cómo podemos mejorarlo?

¡Gracias por tus comentarios!

Sección 5. Capítulo 3
single

single

some-alt