Desafío: Implementación de un Árbol de Decisión
En este desafío, se utilizará el conjunto de datos Titanic, que contiene información sobre los pasajeros del Titanic, incluyendo su edad, sexo, tamaño de la familia y más. El objetivo es predecir si un pasajero sobrevivió o no.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b71ff7ac-3932-41d2-a4d8-060e24b00129/titanic.csv') print(df.head())
Para implementar el Árbol de Decisión, se puede utilizar DecisionTreeClassifier
de sklearn
:
Su tarea es construir un Árbol de Decisión y encontrar los mejores valores para max_depth
y min_samples_leaf
utilizando búsqueda en cuadrícula.
Swipe to start coding
Se proporciona un conjunto de datos del Titanic almacenado como un DataFrame
en la variable df
.
- Inicializar un modelo de Árbol de Decisión y almacenarlo en la variable
decision_tree
. - Crear un diccionario para
GridSearchCV
que itere a través de los valores[1, 2, 3, 4, 5, 6, 7]
paramax_depth
y[1, 2, 4, 6]
paramin_samples_leaf
, y almacenarlo en la variableparam_grid
. - Inicializar y entrenar un objeto
GridSearchCV
, establecer el número de particiones en10
y almacenar el modelo entrenado en la variablegrid_cv
.
Solución
¡Gracias por tus comentarios!
single
Pregunte a AI
Pregunte a AI
Pregunte lo que quiera o pruebe una de las preguntas sugeridas para comenzar nuestra charla
Awesome!
Completion rate improved to 4.17
Desafío: Implementación de un Árbol de Decisión
Desliza para mostrar el menú
En este desafío, se utilizará el conjunto de datos Titanic, que contiene información sobre los pasajeros del Titanic, incluyendo su edad, sexo, tamaño de la familia y más. El objetivo es predecir si un pasajero sobrevivió o no.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b71ff7ac-3932-41d2-a4d8-060e24b00129/titanic.csv') print(df.head())
Para implementar el Árbol de Decisión, se puede utilizar DecisionTreeClassifier
de sklearn
:
Su tarea es construir un Árbol de Decisión y encontrar los mejores valores para max_depth
y min_samples_leaf
utilizando búsqueda en cuadrícula.
Swipe to start coding
Se proporciona un conjunto de datos del Titanic almacenado como un DataFrame
en la variable df
.
- Inicializar un modelo de Árbol de Decisión y almacenarlo en la variable
decision_tree
. - Crear un diccionario para
GridSearchCV
que itere a través de los valores[1, 2, 3, 4, 5, 6, 7]
paramax_depth
y[1, 2, 4, 6]
paramin_samples_leaf
, y almacenarlo en la variableparam_grid
. - Inicializar y entrenar un objeto
GridSearchCV
, establecer el número de particiones en10
y almacenar el modelo entrenado en la variablegrid_cv
.
Solución
¡Gracias por tus comentarios!
single