Kurssisisältö
Pandas Ensimmäiset Askeleet
Pandas Ensimmäiset Askeleet
1. Ensimmäiset Askeleet
Mikä On Pandas?SarjatHaaste: Sarjan LuominenDatarunkoVisailu: Sarjan LuominenVisailu: DataFrame LuominenUuden Sarakkeen LisääminenUuden Sarakkeen LisääminenRivin/Sarakkeen PoistaminenVisailu: Toimintojen YhdistäminenTyöskentely Sarakkeiden KanssaVisailu: Sarakkeiden PoimiminenIloc PerusteetHaaste: iloc:n Käyttäminen
2. Tiedostojen Lukeminen Pandasilla
3. Datan Analysointi
Datan TarkasteluVisailu: Head-Funktion KäyttöVisailu: Head, Tail ja SampleTutkitaan TietojoukkoaSarakkeiden Nimet ja TietotyypitNull-Arvojen LöytäminenVisailu: Null-Arvojen TunnistaminenHaaste: Null-Arvojen PoistaminenHaaste: Täyttää Null-ArvotVisailu: Null-ArvotKuvaillaan TietojaMax() ja Min()Visailu: Tilastolliset ToiminnotSum() ja Count()Ainutlaatuiset Arvot
Iloc Perusteet
Voit myös käyttää DataFramen rivejä niiden indeksin avulla. On useita tapoja tehdä tämä:
.iloc
- käytetään rivien hakemiseen niiden numeerisen indeksin perusteella, alkaen 0:sta;.loc
- käytetään rivien hakemiseen niiden merkkijonotunnisteen perusteella.
Tässä kurssissa keskitymme yksinomaan .iloc
-attribuutin käyttöön.
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) print(countries)
DataFramella on seuraava rakenne:
Voit huomata ensimmäisen sarakkeen, joka toimii rivin indeksinä. Käytämme näitä indeksejä päästäksemme käsiksi tiettyihin riveihin DataFramessa. Tämän attribuutin syntaksi on seuraava:
df.iloc[index]
Voimme käyttää tätä attribuuttia päästäksemme käsiksi DataFramemme kolmanteen ja seitsemänteen riviin:
import pandas as pd countries_data = {'country' : ['Thailand', 'Philippines', 'Monaco', 'Malta', 'Sweden', 'Paraguay', 'Latvia'], 'continent' : ['Asia', 'Asia', 'Europe', 'Europe', 'Europe', 'South America', 'Europe'], 'capital':['Bangkok', 'Manila', 'Monaco', 'Valletta', 'Stockholm', 'Asuncion', 'Riga']} countries = pd.DataFrame(countries_data) # Accessing to the third and seventh rows print(countries.iloc[2]) print(countries.iloc[6])
Kun suoritat yllä olevan koodin, saat rivit, jotka vastaavat alla olevassa kuvassa ilmoitettuja indeksejä:
Oliko kaikki selvää?
Kiitos palautteestasi!
Osio 1. Luku 13