Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Lernen Herausforderung: Kodierung Kategorialer Variablen | Datenvorverarbeitung mit Scikit-Learn
ML-Einführung Mit Scikit-Learn

bookHerausforderung: Kodierung Kategorialer Variablen

Zur Zusammenfassung der vorherigen drei Kapitel finden Sie hier eine Tabelle, die zeigt, welchen Encoder Sie verwenden sollten:

In dieser Aufgabe wird der Pinguin-Datensatz (ohne fehlende Werte) bereitgestellt. Alle kategorialen Merkmale, einschließlich des Zielwerts (Spalte 'species'), müssen codiert werden.

Hier eine Erinnerung an die Struktur des Datensatzes:

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
copy

Beachten Sie, dass 'island' und 'sex' kategoriale Merkmale sind und 'species' ein kategoriales Ziel ist.

Aufgabe

Swipe to start coding

Sie erhalten ein DataFrame namens df, das Pinguindaten enthält.
Ihre Aufgabe ist es, alle kategorialen Merkmale so zu kodieren, dass die Daten in einem Machine-Learning-Modell verwendet werden können.

  1. Importieren Sie die Klassen OneHotEncoder und LabelEncoder aus sklearn.preprocessing.
  2. Trennen Sie die Merkmalsmatrix X und die Zielvariable y aus dem DataFrame.
  3. Erstellen Sie ein OneHotEncoder-Objekt und wenden Sie es auf die Spalten 'island' und 'sex' in X an.
  4. Ersetzen Sie die ursprünglichen kategorialen Spalten durch die kodierten Spalten.
  5. Erstellen Sie ein LabelEncoder-Objekt und wenden Sie es auf die Spalte 'species' an, um die Zielvariable y zu kodieren.

Lösung

War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 2. Kapitel 8
single

single

Fragen Sie AI

expand

Fragen Sie AI

ChatGPT

Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen

Suggested prompts:

Which encoder should I use for each column in the penguins dataset?

Can you explain the difference between OrdinalEncoder, OneHotEncoder, and LabelEncoder?

What are the next steps to encode the categorical features and target in this dataset?

close

Awesome!

Completion rate improved to 3.13

bookHerausforderung: Kodierung Kategorialer Variablen

Swipe um das Menü anzuzeigen

Zur Zusammenfassung der vorherigen drei Kapitel finden Sie hier eine Tabelle, die zeigt, welchen Encoder Sie verwenden sollten:

In dieser Aufgabe wird der Pinguin-Datensatz (ohne fehlende Werte) bereitgestellt. Alle kategorialen Merkmale, einschließlich des Zielwerts (Spalte 'species'), müssen codiert werden.

Hier eine Erinnerung an die Struktur des Datensatzes:

12345
import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
copy

Beachten Sie, dass 'island' und 'sex' kategoriale Merkmale sind und 'species' ein kategoriales Ziel ist.

Aufgabe

Swipe to start coding

Sie erhalten ein DataFrame namens df, das Pinguindaten enthält.
Ihre Aufgabe ist es, alle kategorialen Merkmale so zu kodieren, dass die Daten in einem Machine-Learning-Modell verwendet werden können.

  1. Importieren Sie die Klassen OneHotEncoder und LabelEncoder aus sklearn.preprocessing.
  2. Trennen Sie die Merkmalsmatrix X und die Zielvariable y aus dem DataFrame.
  3. Erstellen Sie ein OneHotEncoder-Objekt und wenden Sie es auf die Spalten 'island' und 'sex' in X an.
  4. Ersetzen Sie die ursprünglichen kategorialen Spalten durch die kodierten Spalten.
  5. Erstellen Sie ein LabelEncoder-Objekt und wenden Sie es auf die Spalte 'species' an, um die Zielvariable y zu kodieren.

Lösung

Switch to desktopWechseln Sie zum Desktop, um in der realen Welt zu übenFahren Sie dort fort, wo Sie sind, indem Sie eine der folgenden Optionen verwenden
War alles klar?

Wie können wir es verbessern?

Danke für Ihr Feedback!

Abschnitt 2. Kapitel 8
single

single

some-alt