Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lära Utmaning: Skapa en Komplett ML-Pipeline | Pipelines
Introduktion till ML med Scikit-learn

bookUtmaning: Skapa en Komplett ML-Pipeline

Skapa nu en pipeline som inkluderar en slutlig estimator. Detta resulterar i en tränad prediktionspipeline som kan generera förutsägelser för nya instanser med hjälp av .predict()-metoden.

Eftersom en prediktor kräver målvariabeln y, koda den separat från pipelinen som byggts för X. Använd LabelEncoder för att koda målet.

Note
Notering

Eftersom förutsägelserna är kodade som 0, 1 eller 2, kan .inverse_transform()-metoden från LabelEncoder användas för att konvertera dem tillbaka till de ursprungliga etiketterna: 'Adelie', 'Chinstrap' eller 'Gentoo'.

Uppgift

Swipe to start coding

Du har fått en DataFrame med namnet df som innehåller pingvindata. Din uppgift är att bygga och träna en komplett maskininlärningspipeline som förbehandlar datan och använder en KNeighborsClassifier-modell.

  1. Koda målvariabeln y med hjälp av klassen LabelEncoder.
  2. Skapa en ColumnTransformer med namnet ct som applicerar en OneHotEncoder på kolumnerna 'island' och 'sex', medan övriga kolumner lämnas oförändrade (remainder='passthrough').
  3. Skapa en pipeline som inkluderar följande steg i ordning:
  • Den ColumnTransformer du definierat (ct);
  • En SimpleImputer med parametern strategy satt till 'most_frequent';
  • En StandardScaler för skalning av variabler;
  • En KNeighborsClassifier som slutlig modell.
  1. Träna pipelinen på funktionerna X och målvariabeln y.
  2. Generera prediktioner för X med den tränade pipelinen och skriv ut de avkodade klassnamnen.

Lösning

Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 3. Kapitel 6
single

single

Fråga AI

expand

Fråga AI

ChatGPT

Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal

Suggested prompts:

How do I use LabelEncoder to encode the target variable?

Can you show me how to add a final estimator to the pipeline?

What is the purpose of encoding the target variable separately from the features?

close

Awesome!

Completion rate improved to 3.13

bookUtmaning: Skapa en Komplett ML-Pipeline

Svep för att visa menyn

Skapa nu en pipeline som inkluderar en slutlig estimator. Detta resulterar i en tränad prediktionspipeline som kan generera förutsägelser för nya instanser med hjälp av .predict()-metoden.

Eftersom en prediktor kräver målvariabeln y, koda den separat från pipelinen som byggts för X. Använd LabelEncoder för att koda målet.

Note
Notering

Eftersom förutsägelserna är kodade som 0, 1 eller 2, kan .inverse_transform()-metoden från LabelEncoder användas för att konvertera dem tillbaka till de ursprungliga etiketterna: 'Adelie', 'Chinstrap' eller 'Gentoo'.

Uppgift

Swipe to start coding

Du har fått en DataFrame med namnet df som innehåller pingvindata. Din uppgift är att bygga och träna en komplett maskininlärningspipeline som förbehandlar datan och använder en KNeighborsClassifier-modell.

  1. Koda målvariabeln y med hjälp av klassen LabelEncoder.
  2. Skapa en ColumnTransformer med namnet ct som applicerar en OneHotEncoder på kolumnerna 'island' och 'sex', medan övriga kolumner lämnas oförändrade (remainder='passthrough').
  3. Skapa en pipeline som inkluderar följande steg i ordning:
  • Den ColumnTransformer du definierat (ct);
  • En SimpleImputer med parametern strategy satt till 'most_frequent';
  • En StandardScaler för skalning av variabler;
  • En KNeighborsClassifier som slutlig modell.
  1. Träna pipelinen på funktionerna X och målvariabeln y.
  2. Generera prediktioner för X med den tränade pipelinen och skriv ut de avkodade klassnamnen.

Lösning

Switch to desktopByt till skrivbordet för praktisk övningFortsätt där du är med ett av alternativen nedan
Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 3. Kapitel 6
single

single

some-alt