Utmaning: Sammanfoga Allt
I denna utmaning tillämpas hela arbetsflödet som lärts ut i kursen — från datapreprocessering till träning och modelevaluering.
Swipe to start coding
Du har fått ett dataset med pingviner. Ditt mål är att bygga en maskininlärningspipeline som klassificerar pingvinarter med hjälp av en K-Nearest Neighbors (KNN)-modell, samtidigt som du hanterar kodning, saknade värden och parameteroptimering på rätt sätt.
- Koda målvariabeln med
LabelEncoder
. - Dela upp datasetet i tränings- och testdata med
test_size=0.33
. - Skapa en ColumnTransformer (
ct
) som endast kodar kolumnerna'island'
och'sex'
med en lämplig kodare för nominaldata (OneHotEncoder
) och lämnar övriga kolumner oförändrade. - Definiera ett parameterraster (
param_grid
) som inkluderar följande värden förn_neighbors
:[1, 3, 5, 7, 9, 12, 15, 20, 25]
. - Skapa ett
GridSearchCV
-objekt medKNeighborsClassifier
som basmodell ochparam_grid
som dess parametrar. - Bygg en pipeline bestående av:
ColumnTransformer
(ct
);- en
SimpleImputer
(strategi ='most_frequent'
); - en
StandardScaler
; - och
GridSearchCV
som sista steg.
- Träna pipelinen med träningsdata (
X_train
,y_train
). - Utvärdera modellen på testdata genom att skriva ut dess
.score(X_test, y_test)
. - Prediktera på testmängden och skriv ut de första 5 avkodade förutsägelserna med
label_enc.inverse_transform()
. - Skriv slutligen ut den bästa estimatormodellen som hittats av
GridSearchCV
.
Lösning
Tack för dina kommentarer!
single
Fråga AI
Fråga AI
Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal
Awesome!
Completion rate improved to 3.13
Utmaning: Sammanfoga Allt
Svep för att visa menyn
I denna utmaning tillämpas hela arbetsflödet som lärts ut i kursen — från datapreprocessering till träning och modelevaluering.
Swipe to start coding
Du har fått ett dataset med pingviner. Ditt mål är att bygga en maskininlärningspipeline som klassificerar pingvinarter med hjälp av en K-Nearest Neighbors (KNN)-modell, samtidigt som du hanterar kodning, saknade värden och parameteroptimering på rätt sätt.
- Koda målvariabeln med
LabelEncoder
. - Dela upp datasetet i tränings- och testdata med
test_size=0.33
. - Skapa en ColumnTransformer (
ct
) som endast kodar kolumnerna'island'
och'sex'
med en lämplig kodare för nominaldata (OneHotEncoder
) och lämnar övriga kolumner oförändrade. - Definiera ett parameterraster (
param_grid
) som inkluderar följande värden förn_neighbors
:[1, 3, 5, 7, 9, 12, 15, 20, 25]
. - Skapa ett
GridSearchCV
-objekt medKNeighborsClassifier
som basmodell ochparam_grid
som dess parametrar. - Bygg en pipeline bestående av:
ColumnTransformer
(ct
);- en
SimpleImputer
(strategi ='most_frequent'
); - en
StandardScaler
; - och
GridSearchCV
som sista steg.
- Träna pipelinen med träningsdata (
X_train
,y_train
). - Utvärdera modellen på testdata genom att skriva ut dess
.score(X_test, y_test)
. - Prediktera på testmängden och skriv ut de första 5 avkodade förutsägelserna med
label_enc.inverse_transform()
. - Skriv slutligen ut den bästa estimatormodellen som hittats av
GridSearchCV
.
Lösning
Tack för dina kommentarer!
single