Ainutlaatuiset Arvot
DataFrame-taulukoissa esiintyy usein päällekkäistä dataa. Esimerkiksi countries-DataFramessa 'continent'-sarake sisältää toistuvia arvoja. On olemassa metodi, joka palauttaa joukon yksilöllisiä arvoja tietystä DataFrame-sarakkeesta.
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
Seuraavaksi käytetään unique()-metodia 'continent'- ja 'country'-sarakkeisiin:
12345678910import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
Joskus kaikkien uniikkien arvojen hakemisen sijaan halutaan tietää kuinka monta erilaista arvoa sarakkeessa on. Tällöin voidaan käyttää nunique()-metodia. Se palauttaa sarakkeen uniikkien arvojen lukumäärän — ei itse arvoja.
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
Swipe to start coding
Sinulle on annettu DataFrame nimeltä audi_cars.
Tavoitteena on tutkia sen tietoja ja tunnistaa yksilölliset arvot Pandas-metodeilla.
- Hae kaikki erilliset arvot sarakkeesta
'year'ja tallenna ne muuttujaanunique_years. - Hae kaikki erilliset arvot sarakkeesta
'fueltype'ja tallenna ne muuttujaanunique_fueltype. - Selvitä polttoainetyyppien määrä sarakkeessa
'fueltype'käyttämällä.nunique()-metodia ja tallenna tulos muuttujaancount_unique_fueltypes.
Ratkaisu
Kiitos palautteestasi!
single
Kysy tekoälyä
Kysy tekoälyä
Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme
Mahtavaa!
Completion arvosana parantunut arvoon 3.03
Ainutlaatuiset Arvot
Pyyhkäise näyttääksesi valikon
DataFrame-taulukoissa esiintyy usein päällekkäistä dataa. Esimerkiksi countries-DataFramessa 'continent'-sarake sisältää toistuvia arvoja. On olemassa metodi, joka palauttaa joukon yksilöllisiä arvoja tietystä DataFrame-sarakkeesta.
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries)
Seuraavaksi käytetään unique()-metodia 'continent'- ja 'country'-sarakkeisiin:
12345678910import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) unique_countries = countries['country'].unique() unique_continents = countries['continent'].unique() print(unique_countries) print(unique_continents)
Joskus kaikkien uniikkien arvojen hakemisen sijaan halutaan tietää kuinka monta erilaista arvoa sarakkeessa on. Tällöin voidaan käyttää nunique()-metodia. Se palauttaa sarakkeen uniikkien arvojen lukumäärän — ei itse arvoja.
1234567import pandas as pd country_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(country_data) print(countries['continent'].nunique())
Swipe to start coding
Sinulle on annettu DataFrame nimeltä audi_cars.
Tavoitteena on tutkia sen tietoja ja tunnistaa yksilölliset arvot Pandas-metodeilla.
- Hae kaikki erilliset arvot sarakkeesta
'year'ja tallenna ne muuttujaanunique_years. - Hae kaikki erilliset arvot sarakkeesta
'fueltype'ja tallenna ne muuttujaanunique_fueltype. - Selvitä polttoainetyyppien määrä sarakkeessa
'fueltype'käyttämällä.nunique()-metodia ja tallenna tulos muuttujaancount_unique_fueltypes.
Ratkaisu
Kiitos palautteestasi!
single