Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Scikit-learnin Käsitteet | Datan Esikäsittely Scikit-learnilla
Koneoppimisen Perusteet Scikit-learnilla

bookScikit-learnin Käsitteet

scikit-learn (tuodaan nimellä sklearn) -kirjasto tarjoaa erilaisia funktioita ja luokkia datan esikäsittelyyn ja mallintamiseen. Tärkeimmät sklearn-oliot ovat estimator, transformer, predictor ja model.

Estimator

Jokainen sklearn-luokka, jolla on .fit()-metodi, luokitellaan estimator-olioksi. .fit()-metodi mahdollistaa olion oppimisen datasta.

Toisin sanoen, .fit()-metodia käytetään olion kouluttamiseen. Se ottaa parametreina X ja y (y on valinnainen ohjaamattomissa oppimistehtävissä).

estimator.fit(X, y) # For supervised learning tasks
estimator.fit(X) # For unsupervised learning tasks

Ei ole kovin hyödyllistä, jos olio vain oppii datasta tuottamatta mitään tulosta. Käytännöllisempiä ovat kaksi estimoijasta periytyvää oliotyyppiä: transformer ja predictor.

Muunnin

Muuntimella on .fit()-metodi ja .transform()-metodi, jotka muuntavat dataa jollakin tavalla.

Yleensä muuntimien täytyy oppia jotain datasta ennen muuntamista, joten sinun täytyy käyttää ensin .fit() ja sitten .transform(). Tämän välttämiseksi muuntimilla on myös .fit_transform()-metodi.
.fit_transform() tuottaa saman tuloksen kuin .fit() ja .transform() peräkkäin, mutta on joskus nopeampi, joten sitä suositellaan käytettäväksi .fit().transform() sijaan.

transformer.fit(X) # Train the transformer
transformer.transform(X) # Transform the data using an already trained transformer
transformer.fit_transform(X) # Train the transformer and transform the data
Note
Huomio

Muuntimia käytetään yleensä X-taulukon muuntamiseen. Kuitenkin, kuten näemme LabelEncoder-esimerkissä, jotkut muuntimet on tarkoitettu y-taulukolle.

Kuvassa koulutusjoukossa näkyvät nan-arvot tarkoittavat puuttuvia tietoja Pythonissa.

Ennustaja

Ennustaja on estimaattori (sisältää .fit()-metodin), jolla on myös .predict()-metodi. .predict()-metodia käytetään ennusteiden tekemiseen.

predictor.fit(X, y) # Training the predictor
predictor.predict(X_new) # Predicting the target for new instances once the predictor is trained. 

Malli

Malli on ennustajan tyyppi, joka sisältää myös .score()-metodin. Tämä metodi laskee pistemäärän (metriikan) ennustajan suorituskyvyn mittaamiseksi.

model.fit(X, y) # Train the model
model.score(X, y) # Calculate a score for the trained model on X, y set.

Kuten edellisessä luvussa mainittiin, tarkkuus on metriikka, joka ilmaisee oikeiden ennusteiden prosenttiosuuden.

Esikäsittelyvaiheessa työskennellään muuntimien kanssa, ja mallinnusvaiheessa työskennellään ennustimien (tarkemmin sanottuna mallien) kanssa.

question mark

Valitse kaikki oikeat väittämät.

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 2. Luku 1

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Awesome!

Completion rate improved to 3.13

bookScikit-learnin Käsitteet

Pyyhkäise näyttääksesi valikon

scikit-learn (tuodaan nimellä sklearn) -kirjasto tarjoaa erilaisia funktioita ja luokkia datan esikäsittelyyn ja mallintamiseen. Tärkeimmät sklearn-oliot ovat estimator, transformer, predictor ja model.

Estimator

Jokainen sklearn-luokka, jolla on .fit()-metodi, luokitellaan estimator-olioksi. .fit()-metodi mahdollistaa olion oppimisen datasta.

Toisin sanoen, .fit()-metodia käytetään olion kouluttamiseen. Se ottaa parametreina X ja y (y on valinnainen ohjaamattomissa oppimistehtävissä).

estimator.fit(X, y) # For supervised learning tasks
estimator.fit(X) # For unsupervised learning tasks

Ei ole kovin hyödyllistä, jos olio vain oppii datasta tuottamatta mitään tulosta. Käytännöllisempiä ovat kaksi estimoijasta periytyvää oliotyyppiä: transformer ja predictor.

Muunnin

Muuntimella on .fit()-metodi ja .transform()-metodi, jotka muuntavat dataa jollakin tavalla.

Yleensä muuntimien täytyy oppia jotain datasta ennen muuntamista, joten sinun täytyy käyttää ensin .fit() ja sitten .transform(). Tämän välttämiseksi muuntimilla on myös .fit_transform()-metodi.
.fit_transform() tuottaa saman tuloksen kuin .fit() ja .transform() peräkkäin, mutta on joskus nopeampi, joten sitä suositellaan käytettäväksi .fit().transform() sijaan.

transformer.fit(X) # Train the transformer
transformer.transform(X) # Transform the data using an already trained transformer
transformer.fit_transform(X) # Train the transformer and transform the data
Note
Huomio

Muuntimia käytetään yleensä X-taulukon muuntamiseen. Kuitenkin, kuten näemme LabelEncoder-esimerkissä, jotkut muuntimet on tarkoitettu y-taulukolle.

Kuvassa koulutusjoukossa näkyvät nan-arvot tarkoittavat puuttuvia tietoja Pythonissa.

Ennustaja

Ennustaja on estimaattori (sisältää .fit()-metodin), jolla on myös .predict()-metodi. .predict()-metodia käytetään ennusteiden tekemiseen.

predictor.fit(X, y) # Training the predictor
predictor.predict(X_new) # Predicting the target for new instances once the predictor is trained. 

Malli

Malli on ennustajan tyyppi, joka sisältää myös .score()-metodin. Tämä metodi laskee pistemäärän (metriikan) ennustajan suorituskyvyn mittaamiseksi.

model.fit(X, y) # Train the model
model.score(X, y) # Calculate a score for the trained model on X, y set.

Kuten edellisessä luvussa mainittiin, tarkkuus on metriikka, joka ilmaisee oikeiden ennusteiden prosenttiosuuden.

Esikäsittelyvaiheessa työskennellään muuntimien kanssa, ja mallinnusvaiheessa työskennellään ennustimien (tarkemmin sanottuna mallien) kanssa.

question mark

Valitse kaikki oikeat väittämät.

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 2. Luku 1
some-alt