Summary  
The pandas .groupby() method groups DataFrame rows by the values in a specified column and lets you apply aggregation functions (e.g., mean, sum, count, min, max, median) to compute summary statistics for each group.

General domain of usage  
Airline flight delay analysis

Watch this video for a visual and auditory walkthrough of the `.groupby()` method in pandas. You will see how to group data by columns, apply aggregation functions like `.sum()` and `.mean()`, and interpret the results using the flight delay dataset. The video reinforces the code examples and table explanations you have just learned, making the grouping and aggregation process clear and practical.

Jeg er glad for at se dig i denne sektion. Her vil vi gruppere vores data for at finde information om forskellige grupper af rækker. Undersøg datasættet om forsinkelser (du kan rulle denne tabel vandret):


Gruppering af data er fordelagtigt, og nu vil vi dykke dybere ned i det. Forestil dig, at du vil beregne antallet af forsinkelser for hvert flynummer. Se på kodeeksemplet og derefter på forklaringen:

import pandas as pd
data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/plane', index_col = 0)
data_flights = data[['Flight', 'Delay']].groupby('Flight').sum()
print(data_flights.head())

**Forklaring:**

```python
data[['Flight', 'Delay']].groupby('Flight').sum()
```

- `data[['Flight', 'Delay']]` - Disse er de kolonner, du arbejder med, inklusive de kolonner, du vil gruppere;
- `groupby('Flight')` - Kolonnen `'Flight'` er argumentet for `.groupby()`-funktionen. Dette betyder, at rækker med samme værdi i kolonnen `'Flight'` bliver grupperet sammen;
- `.sum()` - Denne funktion opererer på rækkerne inden for hver gruppe oprettet af `.groupby()`. I dette tilfælde summeres værdierne i kolonnen `'Delay'` for rækker, der tilhører samme `'Flight'`-gruppe.

Da kolonnen `'Delay'` kun indeholder `0` (ingen forsinkelse) eller `1` (en forsinkelse) som mulige værdier, repræsenterer summen af rækkerne antallet af forsinkelser for hver flyvning.

Bemærk

Faktisk er `.sum()` blot en af mange aggregeringsfunktioner, du kan bruge. Du vil blive fortrolig med dem alle, efterhånden som du fortsætter.

Dette kursus indeholder mange nyttige funktioner for en kommende dataanalytiker. Du vil lære forskellige måder at udtrække data på og endda sætte betingelser for dem. Herefter vil du blive fortrolig med metoder til gruppering af data. Du vil også lære, hvordan man forbehandler data. Hvert afsnit har sit eget datasæt, så kurset bliver spændende.

Dette afsnit vil lære dig, hvordan du kan udtrække specifikke kolonner ved hjælp af deres titler eller indekser. Du vil også blive introduceret til måder, hvorpå du kan vælge rækker ud fra deres indekser.

Her vil du lære, hvordan man udtrækker data, der opfylder specifikke betingelser. Du vil også lære, hvordan man kombinerer dem og endda opretter dine egne.

I dette afsnit vil du udvide din viden om at opstille forskellige datakriterier. Du vil lære at kontrollere, om dine data er i en defineret liste af værdier eller mellem to værdier. Du vil også lære, hvordan du finder de største og mindste værdier.

Dette afsnit er et af de mest fascinerende i kurset. Her vil du lære, hvordan man grupperer data på forskellige måder. Det vil hjælpe dig som dataanalytiker med at finde information om specifikke datagrupper.

Dette afsnit er et af de mest betydningsfulde for en dataanalytiker, fordi det vil være umuligt at arbejde med data, hvis de indeholder manglende dataværdier i forkert format. Derfor vil du her lære, hvordan man håndterer sådanne upassende værdier.

DayOfWeek	Time
3	804.993130
4	804.452984
5	702.888362

Bliv Fortrolig med .groupby()-Metoden