Kursinhalt
Klassifikation mit Python
Klassifikation mit Python
Herausforderung: Modelle Vergleichen
Jetzt werden wir die Modelle, die wir an einem Datensatz gelernt haben, vergleichen. Dies ist ein Brustkrebs-Datensatz. Das Ziel ist die 'diagnosis'
-Spalte (1 – bösartig, 0 – gutartig).
Wir werden GridSearchCV
auf jedes Modell anwenden, um die besten Parameter zu finden. Außerdem verwenden wir in dieser Aufgabe die Recall-Metrik für die Bewertung, da wir keine False Negatives haben möchten. GridSearchCV
kann die Parameter basierend auf der Recall-Metrik auswählen, wenn Sie scoring='recall'
setzen.
Swipe to start coding
Die Aufgabe besteht darin, alle Modelle, die wir gelernt haben, zu erstellen und die besten Parameter zusammen mit dem besten Recall-Wert jedes Modells auszugeben. Sie müssen die Parameternamen in den param_grid
-Dictionaries ausfüllen.
- Für das k-NN-Modell finden Sie den besten
n_neighbors
-Wert aus[3, 5, 7, 12]
. - Für die logistische Regression durchlaufen Sie die Werte
[0.1, 1, 10]
vonC
. - Für einen Entscheidungsbaum möchten wir zwei Parameter konfigurieren,
max_depth
undmin_samples_leaf
. Durchlaufen Sie die Werte[2, 4, 6, 10]
fürmax_depth
und[1, 2, 4, 7]
fürmin_samples_leaf
. - Für einen Random Forest finden Sie den besten
max_depth
(maximale Tiefe jedes Baums) Wert aus[2, 4, 6]
und die beste Anzahl von Bäumen(n_estimators
). Versuchen Sie die Werte[20, 50, 100]
für die Anzahl der Bäume.
Lösung
Hinweis
Der Code benötigt einige Zeit zum Ausführen (weniger als eine Minute).
Danke für Ihr Feedback!
Herausforderung: Modelle Vergleichen
Jetzt werden wir die Modelle, die wir an einem Datensatz gelernt haben, vergleichen. Dies ist ein Brustkrebs-Datensatz. Das Ziel ist die 'diagnosis'
-Spalte (1 – bösartig, 0 – gutartig).
Wir werden GridSearchCV
auf jedes Modell anwenden, um die besten Parameter zu finden. Außerdem verwenden wir in dieser Aufgabe die Recall-Metrik für die Bewertung, da wir keine False Negatives haben möchten. GridSearchCV
kann die Parameter basierend auf der Recall-Metrik auswählen, wenn Sie scoring='recall'
setzen.
Swipe to start coding
Die Aufgabe besteht darin, alle Modelle, die wir gelernt haben, zu erstellen und die besten Parameter zusammen mit dem besten Recall-Wert jedes Modells auszugeben. Sie müssen die Parameternamen in den param_grid
-Dictionaries ausfüllen.
- Für das k-NN-Modell finden Sie den besten
n_neighbors
-Wert aus[3, 5, 7, 12]
. - Für die logistische Regression durchlaufen Sie die Werte
[0.1, 1, 10]
vonC
. - Für einen Entscheidungsbaum möchten wir zwei Parameter konfigurieren,
max_depth
undmin_samples_leaf
. Durchlaufen Sie die Werte[2, 4, 6, 10]
fürmax_depth
und[1, 2, 4, 7]
fürmin_samples_leaf
. - Für einen Random Forest finden Sie den besten
max_depth
(maximale Tiefe jedes Baums) Wert aus[2, 4, 6]
und die beste Anzahl von Bäumen(n_estimators
). Versuchen Sie die Werte[20, 50, 100]
für die Anzahl der Bäume.
Lösung
Hinweis
Der Code benötigt einige Zeit zum Ausführen (weniger als eine Minute).
Danke für Ihr Feedback!