Uitdaging: Alles Samenbrengen
In deze uitdaging wordt de volledige workflow toegepast die in de cursus is behandeld — van gegevensvoorbewerking tot en met training en modelbeoordeling.





Taak
Swipe to start coding
- Encodeer het doelwit.
- Splits de data zodat 33% wordt gebruikt voor de testset en de rest voor de trainingsset.
- Maak een
ColumnTransformer
om alleen de kolommen'island'
en'sex'
te coderen. Zorg ervoor dat de andere kolommen onaangetast blijven. Gebruik een geschikte encoder voor nominale data. - Vul de ontbrekende waarden in een
param_grid
aan om de volgende waarden voor het aantal buren te proberen:[1, 3, 5, 7, 9, 12, 15, 20, 25]
. - Maak een
GridSearchCV
-object met deKNeighborsClassifier
als model. - Stel een pipeline samen die begint met
ct
als eerste stap, gevolgd door imputatie met de meest voorkomende waarde, standaardisatie, en eindigt metGridSearchCV
als laatste estimator. - Train het model met behulp van een pipeline op de trainingsset.
- Evalueer het model op de testset. (Print de score)
- Verkrijg een voorspelde target voor
X_test
. - Print de beste estimator gevonden door
grid_search
.
Oplossing
Was alles duidelijk?
Bedankt voor je feedback!
Sectie 4. Hoofdstuk 10
single
Vraag AI
Vraag AI
Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.
Awesome!
Completion rate improved to 3.13
Uitdaging: Alles Samenbrengen
Veeg om het menu te tonen
In deze uitdaging wordt de volledige workflow toegepast die in de cursus is behandeld — van gegevensvoorbewerking tot en met training en modelbeoordeling.





Taak
Swipe to start coding
- Encodeer het doelwit.
- Splits de data zodat 33% wordt gebruikt voor de testset en de rest voor de trainingsset.
- Maak een
ColumnTransformer
om alleen de kolommen'island'
en'sex'
te coderen. Zorg ervoor dat de andere kolommen onaangetast blijven. Gebruik een geschikte encoder voor nominale data. - Vul de ontbrekende waarden in een
param_grid
aan om de volgende waarden voor het aantal buren te proberen:[1, 3, 5, 7, 9, 12, 15, 20, 25]
. - Maak een
GridSearchCV
-object met deKNeighborsClassifier
als model. - Stel een pipeline samen die begint met
ct
als eerste stap, gevolgd door imputatie met de meest voorkomende waarde, standaardisatie, en eindigt metGridSearchCV
als laatste estimator. - Train het model met behulp van een pipeline op de trainingsset.
- Evalueer het model op de testset. (Print de score)
- Verkrijg een voorspelde target voor
X_test
. - Print de beste estimator gevonden door
grid_search
.
Oplossing
Was alles duidelijk?
Bedankt voor je feedback!
Awesome!
Completion rate improved to 3.13Sectie 4. Hoofdstuk 10
single