Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Puuttuvien Arvojen Löytäminen | Datan Analysointi
Pandas Ensimmäiset Askeleet

bookPuuttuvien Arvojen Löytäminen

DataFrame-taulukoissa esiintyy usein puuttuvia arvoja, jotka on merkitty None- tai NaN-arvoilla. Työskenneltäessä DataFramejen kanssa on tärkeää tunnistaa nämä puuttuvat arvot, sillä ne voivat vääristää laskelmia, johtaa virheellisiin analyyseihin ja heikentää tulosten luotettavuutta.

Puuttuvien arvojen käsittely varmistaa datan eheyden ja parantaa tehtävien, kuten tilastollisen analyysin ja koneoppimisen, suorituskykyä. Tätä varten pandas tarjoaa erityisiä menetelmiä.

Ensimmäinen näistä on isna(), joka palauttaa totuusarvotaulukon (boolean DataFrame). Tässä yhteydessä True-arvo osoittaa puuttuvan arvon DataFramessa, kun taas False tarkoittaa, että arvo on olemassa.

Selkeyden vuoksi sovelletaan tätä menetelmää animals-DataFrameen. isna()-menetelmä palauttaa DataFrame-taulukon, jossa on True/False-arvoja; jokainen True ilmaisee puuttuvan arvon animals-DataFramessa.

123456789
import pandas as pd import numpy as np animals_data = {'animal': [np.NaN, 'Dog', np.NaN, 'Cat','Parrot', None], 'name': ['Dolly', None, 'Erin', 'Kelly', None, 'Odie']} animals = pd.DataFrame(animals_data) # Find missing values missing_values = animals.isna() print(missing_values)
copy

Toinen menetelmä on isnull(). Se toimii samalla tavalla kuin edellinen, eikä niiden välillä ole havaittavaa eroa.

Tehtävä

Swipe to start coding

Sinulle on annettu DataFrame nimeltä wine_data.

  • Hae tästä DataFrame:stä puuttuvat arvot ja tallenna tulos muuttujaan missing_values.

Ratkaisu

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 3. Luku 6
single

single

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Suggested prompts:

What is the difference between None and NaN in pandas?

Can you explain how to handle or fill missing values in a DataFrame?

Why is it important to identify missing values before analysis?

close

Awesome!

Completion rate improved to 3.03

bookPuuttuvien Arvojen Löytäminen

Pyyhkäise näyttääksesi valikon

DataFrame-taulukoissa esiintyy usein puuttuvia arvoja, jotka on merkitty None- tai NaN-arvoilla. Työskenneltäessä DataFramejen kanssa on tärkeää tunnistaa nämä puuttuvat arvot, sillä ne voivat vääristää laskelmia, johtaa virheellisiin analyyseihin ja heikentää tulosten luotettavuutta.

Puuttuvien arvojen käsittely varmistaa datan eheyden ja parantaa tehtävien, kuten tilastollisen analyysin ja koneoppimisen, suorituskykyä. Tätä varten pandas tarjoaa erityisiä menetelmiä.

Ensimmäinen näistä on isna(), joka palauttaa totuusarvotaulukon (boolean DataFrame). Tässä yhteydessä True-arvo osoittaa puuttuvan arvon DataFramessa, kun taas False tarkoittaa, että arvo on olemassa.

Selkeyden vuoksi sovelletaan tätä menetelmää animals-DataFrameen. isna()-menetelmä palauttaa DataFrame-taulukon, jossa on True/False-arvoja; jokainen True ilmaisee puuttuvan arvon animals-DataFramessa.

123456789
import pandas as pd import numpy as np animals_data = {'animal': [np.NaN, 'Dog', np.NaN, 'Cat','Parrot', None], 'name': ['Dolly', None, 'Erin', 'Kelly', None, 'Odie']} animals = pd.DataFrame(animals_data) # Find missing values missing_values = animals.isna() print(missing_values)
copy

Toinen menetelmä on isnull(). Se toimii samalla tavalla kuin edellinen, eikä niiden välillä ole havaittavaa eroa.

Tehtävä

Swipe to start coding

Sinulle on annettu DataFrame nimeltä wine_data.

  • Hae tästä DataFrame:stä puuttuvat arvot ja tallenna tulos muuttujaan missing_values.

Ratkaisu

Switch to desktopVaihda työpöytään todellista harjoitusta vartenJatka siitä, missä olet käyttämällä jotakin alla olevista vaihtoehdoista
Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 3. Luku 6
single

single

some-alt