Summary  
The pandas .groupby() method groups DataFrame rows by the values in a specified column and lets you apply aggregation functions (e.g., mean, sum, count, min, max, median) to compute summary statistics for each group.

General domain of usage  
Airline flight delay analysis

Watch this video for a visual and auditory walkthrough of the `.groupby()` method in pandas. You will see how to group data by columns, apply aggregation functions like `.sum()` and `.mean()`, and interpret the results using the flight delay dataset. The video reinforces the code examples and table explanations you have just learned, making the grouping and aggregation process clear and practical.

Me alegra verte en esta sección. Aquí, agruparemos nuestros datos para encontrar información sobre diferentes grupos de filas. Examina el conjunto de datos sobre retrasos (puedes desplazarte horizontalmente por esta tabla):


Agrupar datos es beneficioso, y ahora profundizaremos en ello. Imagina que quieres calcular el número de retrasos para cada número de vuelo. Observa el ejemplo de código y luego la explicación:

import pandas as pd
data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/plane', index_col = 0)
data_flights = data[['Flight', 'Delay']].groupby('Flight').sum()
print(data_flights.head())

**Explicación:**

```python
data[['Flight', 'Delay']].groupby('Flight').sum()
```

- `data[['Flight', 'Delay']]` - Estas son las columnas sobre las que se trabajará, incluyendo las columnas por las que se agrupará;
- `groupby('Flight')` - La columna `'Flight'` es el argumento para la función `.groupby()`. Esto significa que las filas con el mismo valor en la columna `'Flight'` se agruparán juntas;
- `.sum()` - Esta función opera sobre las filas dentro de cada grupo creado por `.groupby()`. En este caso, suma los valores en la columna `'Delay'` para las filas que pertenecen al mismo grupo de `'Flight'`.

Dado que la columna `'Delay'` contiene únicamente `0` (no ocurrió retraso) o `1` (ocurrió un retraso) como valores posibles, la suma de las filas representa el número de retrasos para cada vuelo.

Nota

De hecho, `.sum()` es una de muchas funciones de agregación que se pueden utilizar. Se presentarán todas ellas a medida que avances.

Este curso contiene muchas funciones útiles para un futuro analista de datos. Aprenderás diferentes formas de extraer datos e incluso establecer condiciones sobre ellos. Después de esto, estarás familiarizado con los métodos de agrupación de datos. Además, aprenderás cómo preprocesar datos. Cada sección tiene su propio conjunto de datos, lo que hace que el curso sea atractivo.

Esta sección te enseñará cómo mostrar columnas específicas por sus títulos o índices. Además, te familiarizarás con las formas en que puedes seleccionar filas por índices.

Aquí aprenderás cómo extraer datos que cumplen condiciones específicas. Además, aprenderás cómo combinarlas e incluso crear tus propias condiciones.

En esta sección, ampliarás tus conocimientos sobre cómo establecer diferentes condiciones de datos. Aprenderás a verificar si tus datos se encuentran en una lista definida de valores o entre dos valores. También aprenderás a encontrar los valores más grandes y más pequeños.

Esta sección es una de las más fascinantes del curso. Aquí aprenderás cómo agrupar datos de diferentes maneras. Te ayudará a trabajar como analista de datos para descubrir información sobre grupos de datos específicos.

Esta sección es una de las más significativas para un analista de datos porque si los datos contienen valores faltantes o en un formato incorrecto, será imposible trabajar con ellos. Por lo tanto, aquí aprenderás cómo tratar con dichos valores inapropiados.

DayOfWeek	Time
3	804.993130
4	804.452984
5	702.888362

Familiarizándose con el método .groupby()