Modelli
Sono stati ora trattati i fondamenti della pre-elaborazione dei dati e della costruzione delle pipeline. Il passo successivo è la modellazione.
Un modello in Scikit-learn è un stimatore che fornisce i metodi .predict()
e .score()
, insieme a .fit()
ereditato da tutti gli stimatori.
.fit()
Una volta che i dati sono stati pre-elaborati e sono pronti per essere utilizzati dal modello, il primo passo nella costruzione di un modello è l'addestramento del modello. Questo viene effettuato utilizzando .fit(X, y)
.
Per addestrare un modello che esegue un compito di apprendimento supervisionato (ad esempio, regressione, classificazione), è necessario fornire sia X
che y
al metodo .fit()
.
Se si affronta un compito di apprendimento non supervisionato (ad esempio, clustering), non sono richiesti dati etichettati, quindi è possibile fornire solo la variabile X
, .fit(X)
. Tuttavia, l'utilizzo di .fit(X, y)
non genererà un errore. Il modello semplicemente ignorerà la variabile y
.
Durante l'addestramento, un modello apprende tutto ciò che è necessario per effettuare previsioni. Ciò che il modello apprende e la durata dell'addestramento dipendono dall'algoritmo scelto. Per ogni compito sono disponibili numerosi modelli, basati su algoritmi differenti. Alcuni si addestrano più lentamente, altri più rapidamente.
Tuttavia, l'addestramento rappresenta generalmente l'aspetto più dispendioso in termini di tempo del machine learning. Se il set di addestramento è ampio, un modello potrebbe richiedere minuti, ore o persino giorni per essere addestrato.
.predict()
Una volta che il modello è stato addestrato utilizzando il metodo .fit()
, può effettuare previsioni. Effettuare una previsione è semplice come chiamare il metodo .predict()
:
model.fit(X, y) # Train a model
y_pred = model.predict(X_new) # Get a prediction
Di solito, si desidera prevedere un target per nuove istanze, X_new
.
.score()
Il metodo .score()
viene utilizzato per misurare le prestazioni di un modello addestrato. Di solito, viene calcolato sul test set (i capitoli successivi spiegheranno di cosa si tratta). Ecco la sintassi:
model.fit(X, y) # Training the model
model.score(X_test, y_test)
Il metodo .score()
richiede i valori reali del target (y_test
nell'esempio). Calcola la previsione per le istanze di X_test
e confronta questa previsione con il vero target (y_test
) utilizzando una metrica. Per impostazione predefinita, questa metrica è la precisione per la classificazione.
X_test
si riferisce alla sottoinsieme del dataset, noto come test set, utilizzato per valutare le prestazioni di un modello dopo l'addestramento. Contiene le caratteristiche (dati di input). y_test
è la corrispondente sottoinsieme di etichette reali per X_test
. Insieme, valutano quanto bene il modello predice nuovi dati non visti.
Grazie per i tuoi commenti!
Chieda ad AI
Chieda ad AI
Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione
Can you explain more about what an estimator is in Scikit-learn?
What are some common algorithms used for modeling in Scikit-learn?
How does the .score() method differ for regression and classification tasks?
Awesome!
Completion rate improved to 3.13
Modelli
Scorri per mostrare il menu
Sono stati ora trattati i fondamenti della pre-elaborazione dei dati e della costruzione delle pipeline. Il passo successivo è la modellazione.
Un modello in Scikit-learn è un stimatore che fornisce i metodi .predict()
e .score()
, insieme a .fit()
ereditato da tutti gli stimatori.
.fit()
Una volta che i dati sono stati pre-elaborati e sono pronti per essere utilizzati dal modello, il primo passo nella costruzione di un modello è l'addestramento del modello. Questo viene effettuato utilizzando .fit(X, y)
.
Per addestrare un modello che esegue un compito di apprendimento supervisionato (ad esempio, regressione, classificazione), è necessario fornire sia X
che y
al metodo .fit()
.
Se si affronta un compito di apprendimento non supervisionato (ad esempio, clustering), non sono richiesti dati etichettati, quindi è possibile fornire solo la variabile X
, .fit(X)
. Tuttavia, l'utilizzo di .fit(X, y)
non genererà un errore. Il modello semplicemente ignorerà la variabile y
.
Durante l'addestramento, un modello apprende tutto ciò che è necessario per effettuare previsioni. Ciò che il modello apprende e la durata dell'addestramento dipendono dall'algoritmo scelto. Per ogni compito sono disponibili numerosi modelli, basati su algoritmi differenti. Alcuni si addestrano più lentamente, altri più rapidamente.
Tuttavia, l'addestramento rappresenta generalmente l'aspetto più dispendioso in termini di tempo del machine learning. Se il set di addestramento è ampio, un modello potrebbe richiedere minuti, ore o persino giorni per essere addestrato.
.predict()
Una volta che il modello è stato addestrato utilizzando il metodo .fit()
, può effettuare previsioni. Effettuare una previsione è semplice come chiamare il metodo .predict()
:
model.fit(X, y) # Train a model
y_pred = model.predict(X_new) # Get a prediction
Di solito, si desidera prevedere un target per nuove istanze, X_new
.
.score()
Il metodo .score()
viene utilizzato per misurare le prestazioni di un modello addestrato. Di solito, viene calcolato sul test set (i capitoli successivi spiegheranno di cosa si tratta). Ecco la sintassi:
model.fit(X, y) # Training the model
model.score(X_test, y_test)
Il metodo .score()
richiede i valori reali del target (y_test
nell'esempio). Calcola la previsione per le istanze di X_test
e confronta questa previsione con il vero target (y_test
) utilizzando una metrica. Per impostazione predefinita, questa metrica è la precisione per la classificazione.
X_test
si riferisce alla sottoinsieme del dataset, noto come test set, utilizzato per valutare le prestazioni di un modello dopo l'addestramento. Contiene le caratteristiche (dati di input). y_test
è la corrispondente sottoinsieme di etichette reali per X_test
. Insieme, valutano quanto bene il modello predice nuovi dati non visti.
Grazie per i tuoi commenti!