Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lära Utmaning: Skapa en Pipeline | Pipelines
ML-introduktion Med Scikit-learn

bookUtmaning: Skapa en Pipeline

I denna utmaning ska du kombinera alla förbehandlingssteg i en enda pipeline med hjälp av den ursprungliga penguins.csv-datamängden.

  1. Ta bort de två raderna med otillräckliga data.
  2. Bygg en pipeline som inkluderar kodning, imputering och skalning.

Du behöver endast koda två kolumner, 'sex' och 'island'. Eftersom du inte vill koda hela X, måste du använda en ColumnTransformer. Därefter appliceras SimpleImputer och StandardScaler på hela X.

Här är en påminnelse om funktionerna make_column_transformer() och make_pipeline() som du kommer att använda.

Uppgift

Swipe to start coding

  1. Importera rätt funktion för att skapa en pipeline.
  2. Skapa en ColumnTransformer med OneHotEncoder applicerad endast på kolumnerna 'sex' och 'island'.
  3. Säkerställ att alla andra kolumner förblir oförändrade.
  4. Skapa en pipeline som innehåller ct du just skapade, SimpleImputer som fyller i saknade värden med det mest frekventa värdet samt en StandardScaler som sista steg.
  5. Transformera X med hjälp av den pipe du skapade.

Lösning

Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

Avsnitt 3. Kapitel 4
single

single

Fråga AI

expand

Fråga AI

ChatGPT

Fråga vad du vill eller prova någon av de föreslagna frågorna för att starta vårt samtal

Suggested prompts:

Can you show me how to build the pipeline step by step?

What should I use for encoding the 'sex' and 'island' columns?

How do I remove the two rows with insufficient data?

close

Awesome!

Completion rate improved to 3.13

bookUtmaning: Skapa en Pipeline

Svep för att visa menyn

I denna utmaning ska du kombinera alla förbehandlingssteg i en enda pipeline med hjälp av den ursprungliga penguins.csv-datamängden.

  1. Ta bort de två raderna med otillräckliga data.
  2. Bygg en pipeline som inkluderar kodning, imputering och skalning.

Du behöver endast koda två kolumner, 'sex' och 'island'. Eftersom du inte vill koda hela X, måste du använda en ColumnTransformer. Därefter appliceras SimpleImputer och StandardScaler på hela X.

Här är en påminnelse om funktionerna make_column_transformer() och make_pipeline() som du kommer att använda.

Uppgift

Swipe to start coding

  1. Importera rätt funktion för att skapa en pipeline.
  2. Skapa en ColumnTransformer med OneHotEncoder applicerad endast på kolumnerna 'sex' och 'island'.
  3. Säkerställ att alla andra kolumner förblir oförändrade.
  4. Skapa en pipeline som innehåller ct du just skapade, SimpleImputer som fyller i saknade värden med det mest frekventa värdet samt en StandardScaler som sista steg.
  5. Transformera X med hjälp av den pipe du skapade.

Lösning

Switch to desktopByt till skrivbordet för praktisk övningFortsätt där du är med ett av alternativen nedan
Var allt tydligt?

Hur kan vi förbättra det?

Tack för dina kommentarer!

close

Awesome!

Completion rate improved to 3.13
Avsnitt 3. Kapitel 4
single

single

some-alt