Herausforderung: Kodierung Kategorialer Variablen
Zur Zusammenfassung der vorherigen drei Kapitel finden Sie hier eine Tabelle, die zeigt, welchen Encoder Sie verwenden sollten:
In dieser Aufgabe arbeiten Sie mit dem Penguins-Datensatz (keine fehlenden Werte). Alle kategorialen Merkmale — einschließlich des Zielwerts 'species' — müssen für den Einsatz im maschinellen Lernen codiert werden.
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Beachte, dass 'island' und 'sex' kategoriale Merkmale sind und 'species' ein kategoriales Ziel ist.
Swipe to start coding
Sie erhalten ein DataFrame namens df. Kodieren Sie alle kategorialen Spalten:
- Importieren Sie
OneHotEncoderundLabelEncoderaussklearn.preprocessing. - Teilen Sie die Daten in
X(Merkmale) undy(Zielvariable) auf. - Erstellen Sie einen
OneHotEncoderund wenden Sie ihn auf die Spalten'island'und'sex'inXan. - Ersetzen Sie diese Originalspalten durch ihre kodierten Versionen.
- Verwenden Sie
LabelEncoderfür die Spalte'species', umyzu kodieren.
Lösung
Danke für Ihr Feedback!
single
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen
Großartig!
Completion Rate verbessert auf 3.13
Herausforderung: Kodierung Kategorialer Variablen
Swipe um das Menü anzuzeigen
Zur Zusammenfassung der vorherigen drei Kapitel finden Sie hier eine Tabelle, die zeigt, welchen Encoder Sie verwenden sollten:
In dieser Aufgabe arbeiten Sie mit dem Penguins-Datensatz (keine fehlenden Werte). Alle kategorialen Merkmale — einschließlich des Zielwerts 'species' — müssen für den Einsatz im maschinellen Lernen codiert werden.
12345import pandas as pd df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_imputed.csv') print(df.head())
Beachte, dass 'island' und 'sex' kategoriale Merkmale sind und 'species' ein kategoriales Ziel ist.
Swipe to start coding
Sie erhalten ein DataFrame namens df. Kodieren Sie alle kategorialen Spalten:
- Importieren Sie
OneHotEncoderundLabelEncoderaussklearn.preprocessing. - Teilen Sie die Daten in
X(Merkmale) undy(Zielvariable) auf. - Erstellen Sie einen
OneHotEncoderund wenden Sie ihn auf die Spalten'island'und'sex'inXan. - Ersetzen Sie diese Originalspalten durch ihre kodierten Versionen.
- Verwenden Sie
LabelEncoderfür die Spalte'species', umyzu kodieren.
Lösung
Danke für Ihr Feedback!
single