Modelle
Die Grundlagen der Datenvorverarbeitung und des Pipeline-Aufbaus wurden nun behandelt. Der nächste Schritt ist das Modellieren.
Ein Modell in Scikit-learn ist ein Estimator, der die Methoden .predict() und .score() sowie .fit() von allen Estimatoren bereitstellt.
.fit()
Sobald die Daten vorverarbeitet und für das Modell bereit sind, besteht der erste Schritt beim Erstellen eines Modells im Trainieren eines Modells. Dies erfolgt mit .fit(X, y).
Für überwachtes Lernen (Regression, Klassifikation) erfordert .fit() sowohl X als auch y.
Für unüberwachtes Lernen (z. B. Clustering) wird nur .fit(X) aufgerufen. Das Übergeben von y führt nicht zu einem Fehler — es wird einfach ignoriert.
Während des Trainings lernt das Modell Muster, die für Vorhersagen benötigt werden. Was gelernt wird und wie lange das Training dauert, hängt vom jeweiligen Algorithmus ab. Das Training ist oft der langsamste Teil des maschinellen Lernens, insbesondere bei großen Datensätzen.
.predict()
Nach dem Training wird .predict() verwendet, um Vorhersagen zu generieren:
model.fit(X, y)
y_pred = model.predict(X_new)
.score()
.score() bewertet ein trainiertes Modell, typischerweise auf einem Testdatensatz:
model.fit(X, y)
model.score(X_test, y_test)
Es vergleicht Vorhersagen mit den tatsächlichen Zielwerten. Standardmäßig ist die Metrik für Klassifikation die Genauigkeit.
X_test bezeichnet den Teil des Datensatzes, bekannt als Testdatensatz, der zur Bewertung der Modellleistung nach dem Training verwendet wird. Er enthält die Merkmale (Eingabedaten). y_test ist der entsprechende Teil der wahren Labels für X_test. Zusammen bewerten sie, wie gut das Modell neue, unbekannte Daten vorhersagt.
Danke für Ihr Feedback!
Fragen Sie AI
Fragen Sie AI
Fragen Sie alles oder probieren Sie eine der vorgeschlagenen Fragen, um unser Gespräch zu beginnen
What are some common algorithms used for modeling in Scikit-learn?
Can you explain the difference between `.fit()`, `.predict()`, and `.score()` in more detail?
How do I choose which metric to use for evaluating my model?
Großartig!
Completion Rate verbessert auf 3.13
Modelle
Swipe um das Menü anzuzeigen
Die Grundlagen der Datenvorverarbeitung und des Pipeline-Aufbaus wurden nun behandelt. Der nächste Schritt ist das Modellieren.
Ein Modell in Scikit-learn ist ein Estimator, der die Methoden .predict() und .score() sowie .fit() von allen Estimatoren bereitstellt.
.fit()
Sobald die Daten vorverarbeitet und für das Modell bereit sind, besteht der erste Schritt beim Erstellen eines Modells im Trainieren eines Modells. Dies erfolgt mit .fit(X, y).
Für überwachtes Lernen (Regression, Klassifikation) erfordert .fit() sowohl X als auch y.
Für unüberwachtes Lernen (z. B. Clustering) wird nur .fit(X) aufgerufen. Das Übergeben von y führt nicht zu einem Fehler — es wird einfach ignoriert.
Während des Trainings lernt das Modell Muster, die für Vorhersagen benötigt werden. Was gelernt wird und wie lange das Training dauert, hängt vom jeweiligen Algorithmus ab. Das Training ist oft der langsamste Teil des maschinellen Lernens, insbesondere bei großen Datensätzen.
.predict()
Nach dem Training wird .predict() verwendet, um Vorhersagen zu generieren:
model.fit(X, y)
y_pred = model.predict(X_new)
.score()
.score() bewertet ein trainiertes Modell, typischerweise auf einem Testdatensatz:
model.fit(X, y)
model.score(X_test, y_test)
Es vergleicht Vorhersagen mit den tatsächlichen Zielwerten. Standardmäßig ist die Metrik für Klassifikation die Genauigkeit.
X_test bezeichnet den Teil des Datensatzes, bekannt als Testdatensatz, der zur Bewertung der Modellleistung nach dem Training verwendet wird. Er enthält die Merkmale (Eingabedaten). y_test ist der entsprechende Teil der wahren Labels für X_test. Zusammen bewerten sie, wie gut das Modell neue, unbekannte Daten vorhersagt.
Danke für Ihr Feedback!