Scorri per mostrare il menu

Sono stati ora trattati i fondamenti della pre-elaborazione dei dati e della costruzione delle pipeline. Il passo successivo è la modellazione.

Un modello in Scikit-learn è un stimatore che fornisce i metodi .predict() e .score(), insieme a .fit() ereditato da tutti gli stimatori.

.fit()

Una volta che i dati sono stati preprocessati e sono pronti per essere utilizzati dal modello, il primo passo nella costruzione di un modello è l'addestramento del modello. Questo viene effettuato utilizzando .fit(X, y).

Nota

Per apprendimento supervisionato (regressione, classificazione), .fit() richiede sia X che y. Per apprendimento non supervisionato (ad esempio, clustering), si utilizza solo .fit(X). Passare y non genera un errore — viene semplicemente ignorato.

Durante l'addestramento, il modello apprende i pattern necessari per la previsione. Ciò che viene appreso e la durata dell'addestramento dipendono dall'algoritmo. L'addestramento è spesso la fase più lenta del ML, soprattutto con dataset di grandi dimensioni.

.predict()

Dopo l'addestramento, utilizzare .predict() per generare previsioni:

model.fit(X, y)
y_pred = model.predict(X_new)

.score()

.score() valuta un modello addestrato, tipicamente su un test set:

model.fit(X, y)
model.score(X_test, y_test)

Confronta le previsioni con i target reali. Per impostazione predefinita, la metrica è accuracy per la classificazione.

Nota

X_test si riferisce alla sottoinsieme del dataset, noto come test set, utilizzato per valutare le prestazioni di un modello dopo l'addestramento. Contiene le caratteristiche (dati di input). y_test è la corrispondente sottoinsieme di etichette reali per X_test. Insieme, valutano quanto bene il modello predice nuovi dati non visti.

Tutto è chiaro?

Grazie per i tuoi commenti!

Sezione 4. Capitolo 1

Chieda ad AI

Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione

Modelli

Sono stati ora trattati i fondamenti della pre-elaborazione dei dati e della costruzione delle pipeline. Il passo successivo è la modellazione.

Un modello in Scikit-learn è un stimatore che fornisce i metodi .predict() e .score(), insieme a .fit() ereditato da tutti gli stimatori.

.fit()

Nota

.predict()

Dopo l'addestramento, utilizzare .predict() per generare previsioni:

model.fit(X, y)
y_pred = model.predict(X_new)

.score()

.score() valuta un modello addestrato, tipicamente su un test set:

model.fit(X, y)
model.score(X_test, y_test)

Confronta le previsioni con i target reali. Per impostazione predefinita, la metrica è accuracy per la classificazione.

Nota

Tutto è chiaro?

Grazie per i tuoi commenti!

Sezione 4. Capitolo 1