Großartig!
Completion Rate verbessert auf 3.13Abschnitt 2. Kapitel 8
single
Herausforderung: Kodierung Kategorialer Variablen
Swipe um das Menü anzuzeigen
Zur Zusammenfassung der vorherigen drei Kapitel finden Sie hier eine Tabelle, die zeigt, welchen Encoder Sie verwenden sollten:
In dieser Aufgabe arbeiten Sie mit dem Penguins-Datensatz (keine fehlenden Werte). Alle kategorialen Merkmale — einschließlich des Zielwerts 'species' — müssen für den Einsatz im maschinellen Lernen codiert werden.
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Beachte, dass 'island' und 'sex' kategoriale Merkmale sind und 'species' ein kategoriales Ziel ist.
Aufgabe
Swipe to start coding
Sie erhalten ein DataFrame namens df. Kodieren Sie alle kategorialen Spalten:
- Importieren Sie
OneHotEncoderundLabelEncoderaussklearn.preprocessing. - Teilen Sie die Daten in
X(Merkmale) undy(Zielvariable) auf. - Erstellen Sie einen
OneHotEncoderund wenden Sie ihn auf die Spalten'island'und'sex'inXan. - Ersetzen Sie diese Originalspalten durch ihre kodierten Versionen.
- Verwenden Sie
LabelEncoderfür die Spalte'species', umyzu kodieren.
Lösung
War alles klar?
Danke für Ihr Feedback!
Abschnitt 2. Kapitel 8
single
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen