Herausforderung: Alles Zusammenführen
In dieser Aufgabe wird der vollständige Workflow aus dem Kurs angewendet – von der Datenvorverarbeitung über das Training bis hin zur Modellevaluierung.





Aufgabe
Swipe to start coding
- Zielvariable kodieren.
- Daten aufteilen, sodass 33% für den Testdatensatz und der Rest für den Trainingsdatensatz verwendet wird.
- Einen
ColumnTransformer
erstellen, um nur die Spalten'island'
und'sex'
zu kodieren. Die anderen Spalten bleiben unverändert. Einen geeigneten Encoder für nominale Daten verwenden. - Die Lücken in einem
param_grid
ausfüllen, um folgende Werte für die Anzahl der Nachbarn zu testen:[1, 3, 5, 7, 9, 12, 15, 20, 25]
. - Ein
GridSearchCV
-Objekt mit demKNeighborsClassifier
als Modell erstellen. - Eine Pipeline konstruieren, die mit
ct
als erstem Schritt beginnt, gefolgt von Imputation mit dem häufigsten Wert, Standardisierung und abschließendGridSearchCV
als letztem Schätzer. - Das Modell mit der Pipeline auf dem Trainingsdatensatz trainieren.
- Das Modell auf dem Testdatensatz evaluieren. (Score ausgeben)
- Eine Vorhersage für das Ziel mit
X_test
erhalten. - Den besten durch
grid_search
gefundenen Schätzer ausgeben.
Lösung
War alles klar?
Danke für Ihr Feedback!
Abschnitt 4. Kapitel 10
single
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen
Suggested prompts:
Can you provide the dataset we'll be working with?
What type of model should I use for this challenge?
Could you outline the specific steps involved in the workflow?
Awesome!
Completion rate improved to 3.13
Herausforderung: Alles Zusammenführen
Swipe um das Menü anzuzeigen
In dieser Aufgabe wird der vollständige Workflow aus dem Kurs angewendet – von der Datenvorverarbeitung über das Training bis hin zur Modellevaluierung.





Aufgabe
Swipe to start coding
- Zielvariable kodieren.
- Daten aufteilen, sodass 33% für den Testdatensatz und der Rest für den Trainingsdatensatz verwendet wird.
- Einen
ColumnTransformer
erstellen, um nur die Spalten'island'
und'sex'
zu kodieren. Die anderen Spalten bleiben unverändert. Einen geeigneten Encoder für nominale Daten verwenden. - Die Lücken in einem
param_grid
ausfüllen, um folgende Werte für die Anzahl der Nachbarn zu testen:[1, 3, 5, 7, 9, 12, 15, 20, 25]
. - Ein
GridSearchCV
-Objekt mit demKNeighborsClassifier
als Modell erstellen. - Eine Pipeline konstruieren, die mit
ct
als erstem Schritt beginnt, gefolgt von Imputation mit dem häufigsten Wert, Standardisierung und abschließendGridSearchCV
als letztem Schätzer. - Das Modell mit der Pipeline auf dem Trainingsdatensatz trainieren.
- Das Modell auf dem Testdatensatz evaluieren. (Score ausgeben)
- Eine Vorhersage für das Ziel mit
X_test
erhalten. - Den besten durch
grid_search
gefundenen Schätzer ausgeben.
Lösung
War alles klar?
Danke für Ihr Feedback!
Awesome!
Completion rate improved to 3.13Abschnitt 4. Kapitel 10
single