Leer Het Model Evalueren

Veeg om het menu te tonen

Bij het bouwen van een voorspellend model is het essentieel om te bepalen hoe goed het presteert voordat het wordt gebruikt voor echte voorspellingen.

Modelbeoordeling meet hoe nauwkeurig het model voorspellingen doet. De .score()-methode biedt deze beoordeling.

Prestaties evalueren op de trainingsset is misleidend, omdat het model waarschijnlijk beter presteert op gegevens die het al heeft gezien. Om een realistische maatstaf te verkrijgen, moet de evaluatie worden uitgevoerd op onbekende gegevens.

Formeel is het doel om een model te creëren dat goed generaliseert.

Definitie

Generalizatie is het vermogen van het model om effectief te presteren op nieuwe, onbekende gegevens, buiten alleen de gegevens waarop het is getraind. Het meet hoe nauwkeurig de voorspellingen van een model kunnen worden toegepast op praktijksituaties buiten de trainingsdataset.

Dit kan worden bereikt door de dataset willekeurig te splitsen in twee delen: een trainingsset om het model te trainen en een testset voor evaluatie.

Het model trainen met de trainingsset en vervolgens evalueren op de testset:

model.fit(X_train, y_train)
print(model.score(X_test, y_test))

Voor het maken van een willekeurige splitsing van de data, gebruik de functie train_test_split() uit de module sklearn.model_selection.

De grootte van de testset hangt doorgaans af van de dataset: 25–40% voor kleine datasets, 10–30% voor middelgrote datasets en minder dan 10% voor grote datasets.

In dit voorbeeld, met slechts 342 instanties (een kleine dataset), wordt 33% toegewezen aan de testset:

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.33)

Hier vertegenwoordigen X_train en y_train de trainingsset, terwijl X_test en y_test de testset vertegenwoordigen.


              123456789101112131415
            
import pandas as pd
from sklearn.neighbors import KNeighborsClassifier
from sklearn.model_selection import train_test_split

df = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/a65bbc96-309e-4df9-a790-a1eb8c815a1c/penguins_pipelined.csv')
# Assign X, y variables (X is already preprocessed and y is already encoded)
X, y = df.drop('species', axis=1), df['species']
# Train-test split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.33)
# Initialize and train a model
knn5 = KNeighborsClassifier().fit(X_train, y_train) # Trained 5 neighbors model
knn1 = KNeighborsClassifier(n_neighbors=1).fit(X_train, y_train) # Trained 1 neighbor model
# Print the scores of both models
print('5 Neighbors score:',knn5.score(X_test, y_test))
print('1 Neighbor score:',knn1.score(X_test, y_test))

Het model is nu getraind met de trainingset via .fit(X_train, y_train) en geëvalueerd met de testset via .score(X_test, y_test).

Omdat train_test_split() de data willekeurig splitst, verschillen de train- en testsets bij elke uitvoering, wat leidt tot variërende scores. Bij een grotere dataset worden deze scores stabieler.

Was alles duidelijk?

Bedankt voor je feedback!

Sectie 4. Hoofdstuk 3

Vraag AI

Vraag wat u wilt of probeer een van de voorgestelde vragen om onze chat te starten.

Sectie 4. Hoofdstuk 3