Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Udfordring: Oprettelse af en Komplet ML-pipeline | Pipelines
ML Introduktion med Scikit-learn

bookUdfordring: Oprettelse af en Komplet ML-pipeline

Opret nu en pipeline, der inkluderer en slutestimator. Dette giver en trænet forudsigelsespipeline, som kan generere forudsigelser for nye instanser ved hjælp af .predict()-metoden.

Da en prædiktor kræver målvariablen y, skal denne kodes separat fra den pipeline, der er oprettet til X. Brug LabelEncoder til at kode target.

Note
Bemærk

Da forudsigelserne er kodet som 0, 1 eller 2, kan .inverse_transform()-metoden fra LabelEncoder bruges til at konvertere dem tilbage til de oprindelige etiketter: 'Adelie', 'Chinstrap' eller 'Gentoo'.

Opgave

Swipe to start coding

Du får en DataFrame kaldet df, som indeholder pingvindata. Din opgave er at opbygge og træne en komplet maskinlæringspipeline, der forbehandler dataene og anvender en KNeighborsClassifier-model.

  1. Kod målvariablen y ved hjælp af klassen LabelEncoder.
  2. Opret en ColumnTransformer ved navn ct, der anvender en OneHotEncoder på kolonnerne 'island' og 'sex', mens de øvrige kolonner forbliver uændrede (remainder='passthrough').
  3. Opret en pipeline, der indeholder følgende trin i rækkefølge:
  • Den ColumnTransformer, du har defineret (ct);
  • En SimpleImputer med parameteren strategy sat til 'most_frequent';
  • En StandardScaler til skalering af features;
  • En KNeighborsClassifier som den endelige model.
  1. Træn pipelinen på features X og målvariabel y.
  2. Generér forudsigelser for X ved hjælp af den trænede pipeline og udskriv de dekodede klassenavne.

Løsning

Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 3. Kapitel 6
single

single

Spørg AI

expand

Spørg AI

ChatGPT

Spørg om hvad som helst eller prøv et af de foreslåede spørgsmål for at starte vores chat

Suggested prompts:

How do I use LabelEncoder to encode the target variable?

Can you show me how to add a final estimator to the pipeline?

What is the purpose of encoding the target variable separately from the features?

close

Awesome!

Completion rate improved to 3.13

bookUdfordring: Oprettelse af en Komplet ML-pipeline

Stryg for at vise menuen

Opret nu en pipeline, der inkluderer en slutestimator. Dette giver en trænet forudsigelsespipeline, som kan generere forudsigelser for nye instanser ved hjælp af .predict()-metoden.

Da en prædiktor kræver målvariablen y, skal denne kodes separat fra den pipeline, der er oprettet til X. Brug LabelEncoder til at kode target.

Note
Bemærk

Da forudsigelserne er kodet som 0, 1 eller 2, kan .inverse_transform()-metoden fra LabelEncoder bruges til at konvertere dem tilbage til de oprindelige etiketter: 'Adelie', 'Chinstrap' eller 'Gentoo'.

Opgave

Swipe to start coding

Du får en DataFrame kaldet df, som indeholder pingvindata. Din opgave er at opbygge og træne en komplet maskinlæringspipeline, der forbehandler dataene og anvender en KNeighborsClassifier-model.

  1. Kod målvariablen y ved hjælp af klassen LabelEncoder.
  2. Opret en ColumnTransformer ved navn ct, der anvender en OneHotEncoder på kolonnerne 'island' og 'sex', mens de øvrige kolonner forbliver uændrede (remainder='passthrough').
  3. Opret en pipeline, der indeholder følgende trin i rækkefølge:
  • Den ColumnTransformer, du har defineret (ct);
  • En SimpleImputer med parameteren strategy sat til 'most_frequent';
  • En StandardScaler til skalering af features;
  • En KNeighborsClassifier som den endelige model.
  1. Træn pipelinen på features X og målvariabel y.
  2. Generér forudsigelser for X ved hjælp af den trænede pipeline og udskriv de dekodede klassenavne.

Løsning

Switch to desktopSkift til skrivebord for at øve i den virkelige verdenFortsæt der, hvor du er, med en af nedenstående muligheder
Var alt klart?

Hvordan kan vi forbedre det?

Tak for dine kommentarer!

Sektion 3. Kapitel 6
single

single

some-alt