Utmaning: Implementering av ett Beslutsträd
I denna utmaning kommer du att använda Titanic-datasetet, som innehåller information om passagerare på Titanic, inklusive deras ålder, kön, familjestorlek och mer. Målet är att förutsäga om en passagerare överlevde eller inte.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b71ff7ac-3932-41d2-a4d8-060e24b00129/titanic.csv') print(df.head())
För att implementera Decision Tree kan du använda DecisionTreeClassifier från sklearn:
Din uppgift är att bygga ett beslutsträd och hitta de bästa värdena för max_depth och min_samples_leaf med hjälp av grid search.
Swipe to start coding
Du har fått en Titanic-datamängd som är lagrad som en DataFrame i variabeln df.
- Initiera en Decision Tree-modell och lagra den i variabeln
decision_tree. - Skapa en ordbok för
GridSearchCVför att iterera genom värdena[1, 2, 3, 4, 5, 6, 7]förmax_depthoch[1, 2, 4, 6]förmin_samples_leaf, och lagra den i variabelnparam_grid. - Initiera och träna ett
GridSearchCV-objekt, sätt antalet foldar till10, och lagra den tränade modellen i variabelngrid_cv.
Lösning
Tack för dina kommentarer!
single
Fråga AI
Fråga AI
Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal
Awesome!
Completion rate improved to 4.17
Utmaning: Implementering av ett Beslutsträd
Svep för att visa menyn
I denna utmaning kommer du att använda Titanic-datasetet, som innehåller information om passagerare på Titanic, inklusive deras ålder, kön, familjestorlek och mer. Målet är att förutsäga om en passagerare överlevde eller inte.
1234import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/b71ff7ac-3932-41d2-a4d8-060e24b00129/titanic.csv') print(df.head())
För att implementera Decision Tree kan du använda DecisionTreeClassifier från sklearn:
Din uppgift är att bygga ett beslutsträd och hitta de bästa värdena för max_depth och min_samples_leaf med hjälp av grid search.
Swipe to start coding
Du har fått en Titanic-datamängd som är lagrad som en DataFrame i variabeln df.
- Initiera en Decision Tree-modell och lagra den i variabeln
decision_tree. - Skapa en ordbok för
GridSearchCVför att iterera genom värdena[1, 2, 3, 4, 5, 6, 7]förmax_depthoch[1, 2, 4, 6]förmin_samples_leaf, och lagra den i variabelnparam_grid. - Initiera och träna ett
GridSearchCV-objekt, sätt antalet foldar till10, och lagra den tränade modellen i variabelngrid_cv.
Lösning
Tack för dina kommentarer!
single