Kursinhalt
Klassifikation mit Python
Klassifikation mit Python
Herausforderung: Den Besten K-Wert Wählen.
Wie in den vorherigen Kapiteln gezeigt, macht das Modell unterschiedliche Vorhersagen für verschiedene k(Wert der Nachbarn)-Werte.
Wenn wir ein Modell erstellen, möchten wir das k wählen, das zur besten Leistung führt. Und im vorherigen Kapitel haben wir gelernt, wie man die Leistung mit Kreuzvalidierung misst.
Eine Schleife auszuführen und Kreuzvalidierungsergebnisse für einige Bereiche von k-Werten zu berechnen, um den höchsten auszuwählen, klingt wie eine Selbstverständlichkeit. Und das ist der am häufigsten verwendete Ansatz. sklearn
hat eine praktische Klasse für diese Aufgabe.
Der param_grid
Parameter nimmt ein Wörterbuch mit Parameternamen als Schlüssel und eine Liste von Elementen, die durchlaufen werden sollen, als Liste. Zum Beispiel, um Werte von 1-99 für n_neighbors
auszuprobieren, würden Sie verwenden:
Die .fit(X, y)
Methode führt das GridSearchCV
Objekt dazu, die besten Parameter aus param_grid
zu finden und das Modell mit den besten Parametern unter Verwendung des gesamten Satzes neu zu trainieren.
Sie können dann die höchste Punktzahl mit dem Attribut .best_score_
erhalten und neue Werte mit der Methode .predict()
vorhersagen.
Swipe to start coding
- Importieren Sie die
GridSearchCV
Klasse. - Skalieren Sie das
X
mitStandardScaler
. - Suchen Sie nach dem besten Wert von
n_neighbors
unter[3, 9, 18, 27]
. - Initialisieren und trainieren Sie ein
GridSearchCV
Objekt mit 4 Falten der Kreuzvalidierung. - Drucken Sie die Punktzahl des besten Modells.
Lösung
Danke für Ihr Feedback!
Herausforderung: Den Besten K-Wert Wählen.
Wie in den vorherigen Kapiteln gezeigt, macht das Modell unterschiedliche Vorhersagen für verschiedene k(Wert der Nachbarn)-Werte.
Wenn wir ein Modell erstellen, möchten wir das k wählen, das zur besten Leistung führt. Und im vorherigen Kapitel haben wir gelernt, wie man die Leistung mit Kreuzvalidierung misst.
Eine Schleife auszuführen und Kreuzvalidierungsergebnisse für einige Bereiche von k-Werten zu berechnen, um den höchsten auszuwählen, klingt wie eine Selbstverständlichkeit. Und das ist der am häufigsten verwendete Ansatz. sklearn
hat eine praktische Klasse für diese Aufgabe.
Der param_grid
Parameter nimmt ein Wörterbuch mit Parameternamen als Schlüssel und eine Liste von Elementen, die durchlaufen werden sollen, als Liste. Zum Beispiel, um Werte von 1-99 für n_neighbors
auszuprobieren, würden Sie verwenden:
Die .fit(X, y)
Methode führt das GridSearchCV
Objekt dazu, die besten Parameter aus param_grid
zu finden und das Modell mit den besten Parametern unter Verwendung des gesamten Satzes neu zu trainieren.
Sie können dann die höchste Punktzahl mit dem Attribut .best_score_
erhalten und neue Werte mit der Methode .predict()
vorhersagen.
Swipe to start coding
- Importieren Sie die
GridSearchCV
Klasse. - Skalieren Sie das
X
mitStandardScaler
. - Suchen Sie nach dem besten Wert von
n_neighbors
unter[3, 9, 18, 27]
. - Initialisieren und trainieren Sie ein
GridSearchCV
Objekt mit 4 Falten der Kreuzvalidierung. - Drucken Sie die Punktzahl des besten Modells.
Lösung
Danke für Ihr Feedback!