Bli Kjent Med .groupby()-Metoden
Jeg er glad for å se deg i denne seksjonen. Her skal vi gruppere dataene våre for å finne informasjon om ulike grupper av rader. Undersøk datasettet om forsinkelser (du kan bla horisontalt i denne tabellen):
Å gruppere data er nyttig, og nå skal vi gå dypere inn i dette. Tenk deg at du ønsker å beregne antall forsinkelser for hvert flynummer. Se på kodeeksempelet og deretter på forklaringen:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/plane', index_col = 0) data_flights = data[['Flight', 'Delay']].groupby('Flight').sum() print(data_flights.head())
Forklaring:
data[['Flight', 'Delay']].groupby('Flight').sum()
data[['Flight', 'Delay']]– Dette er kolonnene du skal arbeide med, inkludert kolonnene du skal gruppere;groupby('Flight')–'Flight'-kolonnen er argumentet for.groupby()-funksjonen. Dette betyr at rader med samme verdi i'Flight'-kolonnen blir gruppert sammen;.sum()– Denne funksjonen opererer på rader innenfor hver gruppe opprettet av.groupby(). I dette tilfellet summeres verdiene i'Delay'-kolonnen for rader som tilhører samme'Flight'-gruppe.
Siden 'Delay'-kolonnen kun inneholder 0 (ingen forsinkelse) eller 1 (forsinkelse) som mulige verdier, representerer summen av radene antall forsinkelser for hver flight.
Faktisk er .sum() én av mange aggregeringsfunksjoner du kan bruke. Du vil bli kjent med alle etter hvert som du fortsetter.
Takk for tilbakemeldingene dine!
Spør AI
Spør AI
Spør om hva du vil, eller prøv ett av de foreslåtte spørsmålene for å starte chatten vår
Awesome!
Completion rate improved to 3.03
Bli Kjent Med .groupby()-Metoden
Sveip for å vise menyen
Jeg er glad for å se deg i denne seksjonen. Her skal vi gruppere dataene våre for å finne informasjon om ulike grupper av rader. Undersøk datasettet om forsinkelser (du kan bla horisontalt i denne tabellen):
Å gruppere data er nyttig, og nå skal vi gå dypere inn i dette. Tenk deg at du ønsker å beregne antall forsinkelser for hvert flynummer. Se på kodeeksempelet og deretter på forklaringen:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/plane', index_col = 0) data_flights = data[['Flight', 'Delay']].groupby('Flight').sum() print(data_flights.head())
Forklaring:
data[['Flight', 'Delay']].groupby('Flight').sum()
data[['Flight', 'Delay']]– Dette er kolonnene du skal arbeide med, inkludert kolonnene du skal gruppere;groupby('Flight')–'Flight'-kolonnen er argumentet for.groupby()-funksjonen. Dette betyr at rader med samme verdi i'Flight'-kolonnen blir gruppert sammen;.sum()– Denne funksjonen opererer på rader innenfor hver gruppe opprettet av.groupby(). I dette tilfellet summeres verdiene i'Delay'-kolonnen for rader som tilhører samme'Flight'-gruppe.
Siden 'Delay'-kolonnen kun inneholder 0 (ingen forsinkelse) eller 1 (forsinkelse) som mulige verdier, representerer summen av radene antall forsinkelser for hver flight.
Faktisk er .sum() én av mange aggregeringsfunksjoner du kan bruke. Du vil bli kjent med alle etter hvert som du fortsetter.
Takk for tilbakemeldingene dine!