Scikit-learnin Käsitteet
scikit-learn (tuodaan nimellä sklearn
) -kirjasto tarjoaa erilaisia funktioita ja luokkia datan esikäsittelyyn ja mallintamiseen. Tärkeimmät sklearn
-oliot ovat estimator, transformer, predictor ja model.
Estimator
Jokainen sklearn
-luokka, jolla on .fit()
-metodi, luokitellaan estimator-olioksi. .fit()
-metodi mahdollistaa olion oppimisen datasta.
Toisin sanoen, .fit()
-metodia käytetään olion kouluttamiseen. Se ottaa parametreina X
ja y
(y
on valinnainen ohjaamattomissa oppimistehtävissä).
estimator.fit(X, y) # For supervised learning tasks
estimator.fit(X) # For unsupervised learning tasks
Ei ole kovin hyödyllistä, jos olio vain oppii datasta tuottamatta mitään tulosta. Käytännöllisempiä ovat kaksi estimoijasta periytyvää oliotyyppiä: transformer ja predictor.
Muunnin
Muuntimella on .fit()
-metodi ja .transform()
-metodi, jotka muuntavat dataa jollakin tavalla.
Yleensä muuntimien täytyy oppia jotain datasta ennen muuntamista, joten sinun täytyy käyttää ensin .fit()
ja sitten .transform()
. Tämän välttämiseksi muuntimilla on myös .fit_transform()
-metodi.
.fit_transform()
tuottaa saman tuloksen kuin .fit()
ja .transform()
peräkkäin, mutta on joskus nopeampi, joten sitä suositellaan käytettäväksi .fit().transform()
sijaan.
transformer.fit(X) # Train the transformer
transformer.transform(X) # Transform the data using an already trained transformer
transformer.fit_transform(X) # Train the transformer and transform the data
Muuntimia käytetään yleensä X
-taulukon muuntamiseen. Kuitenkin, kuten näemme LabelEncoder
-esimerkissä, jotkut muuntimet on tarkoitettu y
-taulukolle.
Kuvassa koulutusjoukossa näkyvät nan
-arvot tarkoittavat puuttuvia tietoja Pythonissa.
Ennustaja
Ennustaja on estimaattori (sisältää .fit()
-metodin), jolla on myös .predict()
-metodi. .predict()
-metodia käytetään ennusteiden tekemiseen.
predictor.fit(X, y) # Training the predictor
predictor.predict(X_new) # Predicting the target for new instances once the predictor is trained.
Malli
Malli on ennustajan tyyppi, joka sisältää myös .score()
-metodin. Tämä metodi laskee pistemäärän (metriikan) ennustajan suorituskyvyn mittaamiseksi.
model.fit(X, y) # Train the model
model.score(X, y) # Calculate a score for the trained model on X, y set.
Kuten edellisessä luvussa mainittiin, tarkkuus on metriikka, joka ilmaisee oikeiden ennusteiden prosenttiosuuden.
Esikäsittelyvaiheessa työskennellään muuntimien kanssa, ja mallinnusvaiheessa työskennellään ennustimien (tarkemmin sanottuna mallien) kanssa.
Kiitos palautteestasi!
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
Awesome!
Completion rate improved to 3.13
Scikit-learnin Käsitteet
Pyyhkäise näyttääksesi valikon
scikit-learn (tuodaan nimellä sklearn
) -kirjasto tarjoaa erilaisia funktioita ja luokkia datan esikäsittelyyn ja mallintamiseen. Tärkeimmät sklearn
-oliot ovat estimator, transformer, predictor ja model.
Estimator
Jokainen sklearn
-luokka, jolla on .fit()
-metodi, luokitellaan estimator-olioksi. .fit()
-metodi mahdollistaa olion oppimisen datasta.
Toisin sanoen, .fit()
-metodia käytetään olion kouluttamiseen. Se ottaa parametreina X
ja y
(y
on valinnainen ohjaamattomissa oppimistehtävissä).
estimator.fit(X, y) # For supervised learning tasks
estimator.fit(X) # For unsupervised learning tasks
Ei ole kovin hyödyllistä, jos olio vain oppii datasta tuottamatta mitään tulosta. Käytännöllisempiä ovat kaksi estimoijasta periytyvää oliotyyppiä: transformer ja predictor.
Muunnin
Muuntimella on .fit()
-metodi ja .transform()
-metodi, jotka muuntavat dataa jollakin tavalla.
Yleensä muuntimien täytyy oppia jotain datasta ennen muuntamista, joten sinun täytyy käyttää ensin .fit()
ja sitten .transform()
. Tämän välttämiseksi muuntimilla on myös .fit_transform()
-metodi.
.fit_transform()
tuottaa saman tuloksen kuin .fit()
ja .transform()
peräkkäin, mutta on joskus nopeampi, joten sitä suositellaan käytettäväksi .fit().transform()
sijaan.
transformer.fit(X) # Train the transformer
transformer.transform(X) # Transform the data using an already trained transformer
transformer.fit_transform(X) # Train the transformer and transform the data
Muuntimia käytetään yleensä X
-taulukon muuntamiseen. Kuitenkin, kuten näemme LabelEncoder
-esimerkissä, jotkut muuntimet on tarkoitettu y
-taulukolle.
Kuvassa koulutusjoukossa näkyvät nan
-arvot tarkoittavat puuttuvia tietoja Pythonissa.
Ennustaja
Ennustaja on estimaattori (sisältää .fit()
-metodin), jolla on myös .predict()
-metodi. .predict()
-metodia käytetään ennusteiden tekemiseen.
predictor.fit(X, y) # Training the predictor
predictor.predict(X_new) # Predicting the target for new instances once the predictor is trained.
Malli
Malli on ennustajan tyyppi, joka sisältää myös .score()
-metodin. Tämä metodi laskee pistemäärän (metriikan) ennustajan suorituskyvyn mittaamiseksi.
model.fit(X, y) # Train the model
model.score(X, y) # Calculate a score for the trained model on X, y set.
Kuten edellisessä luvussa mainittiin, tarkkuus on metriikka, joka ilmaisee oikeiden ennusteiden prosenttiosuuden.
Esikäsittelyvaiheessa työskennellään muuntimien kanssa, ja mallinnusvaiheessa työskennellään ennustimien (tarkemmin sanottuna mallien) kanssa.
Kiitos palautteestasi!