Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
Oppiskele Pivot-taulukoiden Käsittely | Datan Yhdistäminen
Edistyneet Tekniikat Pandas-Kirjastossa

bookPivot-taulukoiden Käsittely

Pythonissa on olemassa analoginen funktio .groupby()-menetelmälle, joka voi tuottaa saman lopputuloksen. Sinä päätät, kumpaa toimintoa käytät. Opitaan tämä esimerkin avulla. Käytämme seuraavaa funktiota, nimeltään .pivot_table(), ja laskemme sarakkeen 'Length' keskiarvot niille riveille, joilla sarakkeen 'Flight' arvo on sama:

123456789101112131415
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/plane', index_col = 0) # The code using .groupby() data_flights_1 = data[['Length', 'Flight']].groupby('Flight').mean() # The same code using .groupby() data_flights_2 = data[['Length', 'Flight']].groupby('Flight').agg('mean') # The same code using .pivot_table() data_flights_3 = pd.pivot_table(data, values = 'Length', index = 'Flight', aggfunc = 'mean') print(data_flights_1.head())
copy

Selitys:

data = pd.pivot_table(data, values = 'Length',
                      index = 'Flight',
                      aggfunc = 'mean')
  • pd.pivot_table() – funktio, joka luo pivot-taulukoita;
  • data – käytettävä data frame;
  • values = 'Length' – argumenttiin values annetaan sarakkeet, joilla on sama ryhmä, ja joille lasketaan esimerkiksi keskiarvo, maksimi jne. Jos haluat ryhmitellä useamman sarakkeen mukaan, laita ne listaan; järjestyksellä ei ole merkitystä;
  • index = 'Flight'index on argumentti, johon annetaan sarakkeen tai sarakkeiden nimi, joiden mukaan halutaan ryhmitellä. Jos haluat ryhmitellä useamman sarakkeen mukaan, laita ne listaan; järjestyksellä on merkitystä, kuten .groupby()-funktiossa;
  • aggfunc = 'mean' – sama kuin agg .groupby()-menetelmässä, aggfunc käyttää täsmälleen samaa syntaksia kuin agg. Voit siis antaa useita funktioita laittamalla ne listaan ja määrittää funktiot eri sarakkeille käyttämällä aaltosulkuja.
question mark

Tässä on esimerkki koodista, joka käyttää .groupby()-lausetta. Valitse vastaava esimerkki, jossa käytetään .pivot_table()-funktiota.

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 4. Luku 5

Kysy tekoälyä

expand

Kysy tekoälyä

ChatGPT

Kysy mitä tahansa tai kokeile jotakin ehdotetuista kysymyksistä aloittaaksesi keskustelumme

Awesome!

Completion rate improved to 3.03

bookPivot-taulukoiden Käsittely

Pyyhkäise näyttääksesi valikon

Pythonissa on olemassa analoginen funktio .groupby()-menetelmälle, joka voi tuottaa saman lopputuloksen. Sinä päätät, kumpaa toimintoa käytät. Opitaan tämä esimerkin avulla. Käytämme seuraavaa funktiota, nimeltään .pivot_table(), ja laskemme sarakkeen 'Length' keskiarvot niille riveille, joilla sarakkeen 'Flight' arvo on sama:

123456789101112131415
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/plane', index_col = 0) # The code using .groupby() data_flights_1 = data[['Length', 'Flight']].groupby('Flight').mean() # The same code using .groupby() data_flights_2 = data[['Length', 'Flight']].groupby('Flight').agg('mean') # The same code using .pivot_table() data_flights_3 = pd.pivot_table(data, values = 'Length', index = 'Flight', aggfunc = 'mean') print(data_flights_1.head())
copy

Selitys:

data = pd.pivot_table(data, values = 'Length',
                      index = 'Flight',
                      aggfunc = 'mean')
  • pd.pivot_table() – funktio, joka luo pivot-taulukoita;
  • data – käytettävä data frame;
  • values = 'Length' – argumenttiin values annetaan sarakkeet, joilla on sama ryhmä, ja joille lasketaan esimerkiksi keskiarvo, maksimi jne. Jos haluat ryhmitellä useamman sarakkeen mukaan, laita ne listaan; järjestyksellä ei ole merkitystä;
  • index = 'Flight'index on argumentti, johon annetaan sarakkeen tai sarakkeiden nimi, joiden mukaan halutaan ryhmitellä. Jos haluat ryhmitellä useamman sarakkeen mukaan, laita ne listaan; järjestyksellä on merkitystä, kuten .groupby()-funktiossa;
  • aggfunc = 'mean' – sama kuin agg .groupby()-menetelmässä, aggfunc käyttää täsmälleen samaa syntaksia kuin agg. Voit siis antaa useita funktioita laittamalla ne listaan ja määrittää funktiot eri sarakkeille käyttämällä aaltosulkuja.
question mark

Tässä on esimerkki koodista, joka käyttää .groupby()-lausetta. Valitse vastaava esimerkki, jossa käytetään .pivot_table()-funktiota.

Select the correct answer

Oliko kaikki selvää?

Miten voimme parantaa sitä?

Kiitos palautteestasi!

Osio 4. Luku 5
some-alt