Desafio: Implementando uma Árvore de Decisão
Neste desafio, será utilizado o conjunto de dados Titanic, que contém informações sobre os passageiros do Titanic, incluindo idade, sexo, tamanho da família e outros dados. O objetivo é prever se um passageiro sobreviveu ou não.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b71ff7ac-3932-41d2-a4d8-060e24b00129/titanic.csv') print(df.head())
Para implementar a Árvore de Decisão, pode-se utilizar o DecisionTreeClassifier
do sklearn
:
Sua tarefa é construir uma Árvore de Decisão e encontrar os melhores valores para max_depth
e min_samples_leaf
utilizando busca em grade.
Swipe to start coding
Você recebe um conjunto de dados do Titanic armazenado como um DataFrame
na variável df
.
- Inicialize um modelo de Árvore de Decisão e armazene-o na variável
decision_tree
. - Crie um dicionário para o
GridSearchCV
para iterar pelos valores[1, 2, 3, 4, 5, 6, 7]
paramax_depth
e[1, 2, 4, 6]
paramin_samples_leaf
, e armazene-o na variávelparam_grid
. - Inicialize e treine um objeto
GridSearchCV
, defina o número de folds como10
e armazene o modelo treinado na variávelgrid_cv
.
Solução
Obrigado pelo seu feedback!
single
Pergunte à IA
Pergunte à IA
Pergunte o que quiser ou experimente uma das perguntas sugeridas para iniciar nosso bate-papo
How do I build a Decision Tree with this dataset?
Can you explain how to use grid search to find the best parameters?
What do max_depth and min_samples_leaf mean in a Decision Tree?
Awesome!
Completion rate improved to 4.17
Desafio: Implementando uma Árvore de Decisão
Deslize para mostrar o menu
Neste desafio, será utilizado o conjunto de dados Titanic, que contém informações sobre os passageiros do Titanic, incluindo idade, sexo, tamanho da família e outros dados. O objetivo é prever se um passageiro sobreviveu ou não.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b71ff7ac-3932-41d2-a4d8-060e24b00129/titanic.csv') print(df.head())
Para implementar a Árvore de Decisão, pode-se utilizar o DecisionTreeClassifier
do sklearn
:
Sua tarefa é construir uma Árvore de Decisão e encontrar os melhores valores para max_depth
e min_samples_leaf
utilizando busca em grade.
Swipe to start coding
Você recebe um conjunto de dados do Titanic armazenado como um DataFrame
na variável df
.
- Inicialize um modelo de Árvore de Decisão e armazene-o na variável
decision_tree
. - Crie um dicionário para o
GridSearchCV
para iterar pelos valores[1, 2, 3, 4, 5, 6, 7]
paramax_depth
e[1, 2, 4, 6]
paramin_samples_leaf
, e armazene-o na variávelparam_grid
. - Inicialize e treine um objeto
GridSearchCV
, defina o número de folds como10
e armazene o modelo treinado na variávelgrid_cv
.
Solução
Obrigado pelo seu feedback!
single