Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Impara Set di Addestramento | Concetti di Machine Learning
Introduzione al ML con Scikit-Learn

bookSet di Addestramento

Nel learning supervisionato o non supervisionato, il training set viene solitamente presentato in formato tabellare.

Un esempio è il diabetes dataset, utilizzato per prevedere se una persona ha il diabete. Contiene i record di 768 donne con parametri quali età, indice di massa corporea e pressione sanguigna. Questi parametri sono chiamati feature.

Il dataset include anche una colonna 'Outcome' che indica se la persona ha il diabete. Questa è la variabile target.

Ogni riga della tabella rappresenta un'istanza (chiamata anche data point o sample), che rappresenta le informazioni relative a un singolo individuo.

La tabella (training set) contiene una colonna target, il che significa che è etichettata.

Il compito è addestrare il modello ML su questo training set e, una volta addestrato, potrà prevedere per altre persone (nuove istanze) se hanno il diabete basandosi solo sulle feature.

Note
Nota

Questo training set è un esempio di dataset biased poiché contiene esclusivamente informazioni su donne di almeno 21 anni. Pertanto, il modello potrebbe produrre previsioni meno accurate per uomini o per donne sotto i 21 anni, poiché non è stato addestrato su questi gruppi.

Durante la programmazione, le colonne delle caratteristiche sono solitamente assegnate a X e le colonne target assegnate come y.

E le caratteristiche delle nuove istanze sono assegnate come X_new.

question-icon

Abbina i nomi delle variabili ai dati che solitamente contengono.

X –
y –

X_new –

Click or drag`n`drop items and fill in the blanks

Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 1. Capitolo 3

Chieda ad AI

expand

Chieda ad AI

ChatGPT

Chieda pure quello che desidera o provi una delle domande suggerite per iniziare la nostra conversazione

Suggested prompts:

What is the difference between features and the target variable?

Can you explain what X, y, and X_new represent in machine learning?

How does the model use X_new to make predictions?

Awesome!

Completion rate improved to 3.13

bookSet di Addestramento

Scorri per mostrare il menu

Nel learning supervisionato o non supervisionato, il training set viene solitamente presentato in formato tabellare.

Un esempio è il diabetes dataset, utilizzato per prevedere se una persona ha il diabete. Contiene i record di 768 donne con parametri quali età, indice di massa corporea e pressione sanguigna. Questi parametri sono chiamati feature.

Il dataset include anche una colonna 'Outcome' che indica se la persona ha il diabete. Questa è la variabile target.

Ogni riga della tabella rappresenta un'istanza (chiamata anche data point o sample), che rappresenta le informazioni relative a un singolo individuo.

La tabella (training set) contiene una colonna target, il che significa che è etichettata.

Il compito è addestrare il modello ML su questo training set e, una volta addestrato, potrà prevedere per altre persone (nuove istanze) se hanno il diabete basandosi solo sulle feature.

Note
Nota

Questo training set è un esempio di dataset biased poiché contiene esclusivamente informazioni su donne di almeno 21 anni. Pertanto, il modello potrebbe produrre previsioni meno accurate per uomini o per donne sotto i 21 anni, poiché non è stato addestrato su questi gruppi.

Durante la programmazione, le colonne delle caratteristiche sono solitamente assegnate a X e le colonne target assegnate come y.

E le caratteristiche delle nuove istanze sono assegnate come X_new.

question-icon

Abbina i nomi delle variabili ai dati che solitamente contengono.

X –
y –

X_new –

Click or drag`n`drop items and fill in the blanks

Tutto è chiaro?

Come possiamo migliorarlo?

Grazie per i tuoi commenti!

Sezione 1. Capitolo 3
some-alt