Udfordring: Oprettelse af en Komplet ML-pipeline
Opret nu en pipeline, der inkluderer en slutestimator. Dette giver en trænet forudsigelsespipeline, som kan generere forudsigelser for nye instanser ved hjælp af .predict()-metoden.
Da en prædiktor kræver målvariablen y, skal denne kodes separat fra den pipeline, der er oprettet til X. Brug LabelEncoder til at kode target.
Da forudsigelserne er kodet som 0, 1 eller 2, kan .inverse_transform()-metoden fra LabelEncoder bruges til at konvertere dem tilbage til de oprindelige etiketter: 'Adelie', 'Chinstrap' eller 'Gentoo'.
Swipe to start coding
Du får en DataFrame kaldet df, som indeholder pingvindata.
Din opgave er at opbygge og træne en komplet maskinlæringspipeline, der forbehandler dataene og anvender en KNeighborsClassifier-model.
- Kod målvariablen
yved hjælp af klassenLabelEncoder. - Opret en
ColumnTransformerved navnct, der anvender enOneHotEncoderpå kolonnerne'island'og'sex', mens de øvrige kolonner forbliver uændrede (remainder='passthrough'). - Opret en pipeline, der indeholder følgende trin i rækkefølge:
- Den
ColumnTransformer, du har defineret (ct); - En
SimpleImputermed parameterenstrategysat til'most_frequent'; - En
StandardScalertil skalering af features; - En
KNeighborsClassifiersom den endelige model.
- Træn pipelinen på features
Xog målvariabely. - Generér forudsigelser for
Xved hjælp af den trænede pipeline og udskriv de dekodede klassenavne.
Løsning
Tak for dine kommentarer!
single
Spørg AI
Spørg AI
Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat
How do I use LabelEncoder to encode the target variable?
Can you show me how to add a final estimator to the pipeline?
What is the purpose of encoding the target variable separately from the features?
Awesome!
Completion rate improved to 3.13
Udfordring: Oprettelse af en Komplet ML-pipeline
Stryg for at vise menuen
Opret nu en pipeline, der inkluderer en slutestimator. Dette giver en trænet forudsigelsespipeline, som kan generere forudsigelser for nye instanser ved hjælp af .predict()-metoden.
Da en prædiktor kræver målvariablen y, skal denne kodes separat fra den pipeline, der er oprettet til X. Brug LabelEncoder til at kode target.
Da forudsigelserne er kodet som 0, 1 eller 2, kan .inverse_transform()-metoden fra LabelEncoder bruges til at konvertere dem tilbage til de oprindelige etiketter: 'Adelie', 'Chinstrap' eller 'Gentoo'.
Swipe to start coding
Du får en DataFrame kaldet df, som indeholder pingvindata.
Din opgave er at opbygge og træne en komplet maskinlæringspipeline, der forbehandler dataene og anvender en KNeighborsClassifier-model.
- Kod målvariablen
yved hjælp af klassenLabelEncoder. - Opret en
ColumnTransformerved navnct, der anvender enOneHotEncoderpå kolonnerne'island'og'sex', mens de øvrige kolonner forbliver uændrede (remainder='passthrough'). - Opret en pipeline, der indeholder følgende trin i rækkefølge:
- Den
ColumnTransformer, du har defineret (ct); - En
SimpleImputermed parameterenstrategysat til'most_frequent'; - En
StandardScalertil skalering af features; - En
KNeighborsClassifiersom den endelige model.
- Træn pipelinen på features
Xog målvariabely. - Generér forudsigelser for
Xved hjælp af den trænede pipeline og udskriv de dekodede klassenavne.
Løsning
Tak for dine kommentarer!
single