Herausforderung: Implementierung eines Entscheidungsbaums
In dieser Aufgabe wird das Titanic-Datenset verwendet, das Informationen über Passagiere der Titanic enthält, darunter Alter, Geschlecht, Familiengröße und weitere Merkmale. Ziel ist es, vorherzusagen, ob ein Passagier überlebt hat oder nicht.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b71ff7ac-3932-41d2-a4d8-060e24b00129/titanic.csv') print(df.head())
Für die Implementierung des Entscheidungsbaums kann der DecisionTreeClassifier aus sklearn verwendet werden:
Die Aufgabe besteht darin, einen Entscheidungsbaum zu erstellen und die optimalen Werte für max_depth und min_samples_leaf mithilfe einer Gitter-Suche zu bestimmen.
Swipe to start coding
Sie erhalten einen Titanic-Datensatz, der als DataFrame in der Variablen df gespeichert ist.
- Initialisieren Sie ein Decision-Tree-Modell und speichern Sie es in der Variablen
decision_tree. - Erstellen Sie ein Dictionary für
GridSearchCV, um mit den Werten[1, 2, 3, 4, 5, 6, 7]fürmax_depthund[1, 2, 4, 6]fürmin_samples_leafzu iterieren, und speichern Sie es in der Variablenparam_grid. - Initialisieren und trainieren Sie ein
GridSearchCV-Objekt, setzen Sie die Anzahl der Folds auf10und speichern Sie das trainierte Modell in der Variablengrid_cv.
Lösung
Danke für Ihr Feedback!
single
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen
How do I build a Decision Tree with this dataset?
Can you explain how to use grid search to find the best parameters?
What do max_depth and min_samples_leaf mean in a Decision Tree?
Awesome!
Completion rate improved to 4.17
Herausforderung: Implementierung eines Entscheidungsbaums
Swipe um das Menü anzuzeigen
In dieser Aufgabe wird das Titanic-Datenset verwendet, das Informationen über Passagiere der Titanic enthält, darunter Alter, Geschlecht, Familiengröße und weitere Merkmale. Ziel ist es, vorherzusagen, ob ein Passagier überlebt hat oder nicht.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b71ff7ac-3932-41d2-a4d8-060e24b00129/titanic.csv') print(df.head())
Für die Implementierung des Entscheidungsbaums kann der DecisionTreeClassifier aus sklearn verwendet werden:
Die Aufgabe besteht darin, einen Entscheidungsbaum zu erstellen und die optimalen Werte für max_depth und min_samples_leaf mithilfe einer Gitter-Suche zu bestimmen.
Swipe to start coding
Sie erhalten einen Titanic-Datensatz, der als DataFrame in der Variablen df gespeichert ist.
- Initialisieren Sie ein Decision-Tree-Modell und speichern Sie es in der Variablen
decision_tree. - Erstellen Sie ein Dictionary für
GridSearchCV, um mit den Werten[1, 2, 3, 4, 5, 6, 7]fürmax_depthund[1, 2, 4, 6]fürmin_samples_leafzu iterieren, und speichern Sie es in der Variablenparam_grid. - Initialisieren und trainieren Sie ein
GridSearchCV-Objekt, setzen Sie die Anzahl der Folds auf10und speichern Sie das trainierte Modell in der Variablengrid_cv.
Lösung
Danke für Ihr Feedback!
single