Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lære Utfordring: Sette Alt Sammen | Modellering
Introduksjon til ML med Scikit-learn

bookUtfordring: Sette Alt Sammen

I denne utfordringen skal du anvende hele arbeidsflyten du har lært i kurset — fra dataprosessering via trening til modelevaluering.

Oppgave

Swipe to start coding

Du har fått et datasett med pingviner. Målet ditt er å bygge en maskinlærings-pipeline som klassifiserer pingvinarter ved hjelp av en K-Nearest Neighbors (KNN)-modell, samtidig som du håndterer koding, manglende verdier og parameteroptimalisering på riktig måte.

  1. Krypter målvariabelen ved å bruke LabelEncoder.
  2. Del datasettet i trenings- og testsett med test_size=0.33.
  3. Lag en ColumnTransformer (ct) som kun koder kolonnene 'island' og 'sex' ved hjelp av en passende koder for nominale data (OneHotEncoder), og lar de andre kolonnene være uberørt.
  4. Definer et parametergrid (param_grid) som inkluderer følgende verdier for n_neighbors: [1, 3, 5, 7, 9, 12, 15, 20, 25].
  5. Lag et GridSearchCV-objekt med KNeighborsClassifier som baseestimator og param_grid som parametere.
  6. Bygg en pipeline bestående av:
  • ColumnTransformer (ct);
  • en SimpleImputer (strategi = 'most_frequent');
  • en StandardScaler;
  • og GridSearchCV som siste steg.
  1. Tren pipelinen ved å bruke treningsdataene (X_train, y_train).
  2. Evaluer modellen på testdataene ved å skrive ut .score(X_test, y_test).
  3. Predikér på testsettet og skriv ut de 5 første dekodede prediksjonene ved hjelp av label_enc.inverse_transform().
  4. Til slutt, skriv ut beste estimator funnet av GridSearchCV.

Løsning

Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 4. Kapittel 10
single

single

Spør AI

expand

Spør AI

ChatGPT

Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår

Suggested prompts:

Can you explain the steps involved in the full workflow shown here?

What is the purpose of each tool or method depicted in the images?

Can you provide a summary of how these components work together in a machine learning project?

close

Awesome!

Completion rate improved to 3.13

bookUtfordring: Sette Alt Sammen

Sveip for å vise menyen

I denne utfordringen skal du anvende hele arbeidsflyten du har lært i kurset — fra dataprosessering via trening til modelevaluering.

Oppgave

Swipe to start coding

Du har fått et datasett med pingviner. Målet ditt er å bygge en maskinlærings-pipeline som klassifiserer pingvinarter ved hjelp av en K-Nearest Neighbors (KNN)-modell, samtidig som du håndterer koding, manglende verdier og parameteroptimalisering på riktig måte.

  1. Krypter målvariabelen ved å bruke LabelEncoder.
  2. Del datasettet i trenings- og testsett med test_size=0.33.
  3. Lag en ColumnTransformer (ct) som kun koder kolonnene 'island' og 'sex' ved hjelp av en passende koder for nominale data (OneHotEncoder), og lar de andre kolonnene være uberørt.
  4. Definer et parametergrid (param_grid) som inkluderer følgende verdier for n_neighbors: [1, 3, 5, 7, 9, 12, 15, 20, 25].
  5. Lag et GridSearchCV-objekt med KNeighborsClassifier som baseestimator og param_grid som parametere.
  6. Bygg en pipeline bestående av:
  • ColumnTransformer (ct);
  • en SimpleImputer (strategi = 'most_frequent');
  • en StandardScaler;
  • og GridSearchCV som siste steg.
  1. Tren pipelinen ved å bruke treningsdataene (X_train, y_train).
  2. Evaluer modellen på testdataene ved å skrive ut .score(X_test, y_test).
  3. Predikér på testsettet og skriv ut de 5 første dekodede prediksjonene ved hjelp av label_enc.inverse_transform().
  4. Til slutt, skriv ut beste estimator funnet av GridSearchCV.

Løsning

Switch to desktopBytt til skrivebordet for virkelighetspraksisFortsett der du er med et av alternativene nedenfor
Alt var klart?

Hvordan kan vi forbedre det?

Takk for tilbakemeldingene dine!

Seksjon 4. Kapittel 10
single

single

some-alt