Summary  
The pandas .groupby() method groups DataFrame rows by the values in a specified column and lets you apply aggregation functions (e.g., mean, sum, count, min, max, median) to compute summary statistics for each group.

General domain of usage  
Airline flight delay analysis

Watch this video for a visual and auditory walkthrough of the `.groupby()` method in pandas. You will see how to group data by columns, apply aggregation functions like `.sum()` and `.mean()`, and interpret the results using the flight delay dataset. The video reinforces the code examples and table explanations you have just learned, making the grouping and aggregation process clear and practical.

このセクションにお越しいただきありがとうございます。ここでは、データをグループ化して、さまざまな行グループに関する情報を取得します。遅延に関するデータセットを確認してください（このテーブルは横にスクロールできます）：


データのグループ化は有用であり、ここからさらに詳しく見ていきます。たとえば、各フライト番号ごとの遅延回数を計算したい場合を考えてみましょう。コード例とその説明を確認してください：

import pandas as pd
data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/plane', index_col = 0)
data_flights = data[['Flight', 'Delay']].groupby('Flight').sum()
print(data_flights.head())

**解説：**

```python
data[['Flight', 'Delay']].groupby('Flight').sum()
```

- `data[['Flight', 'Delay']]` - 操作対象となる列。グループ化する列も含む；
- `groupby('Flight')` - `'Flight'` 関数の引数は `.groupby()` 列。同じ `'Flight'` の値を持つ行がまとめてグループ化される；
- `.sum()` - `.groupby()` で作成された各グループ内の行に対して集計処理を行う関数。この場合、同じ `'Delay'` グループに属する行の `'Flight'` 列の値を合計する。

`'Delay'` 列には `0`（遅延なし）または `1`（遅延あり）のみが格納されているため、行の合計値は各フライトの遅延回数を表す。

注意

実際、`.sum()` は利用可能な集約関数のひとつに過ぎない。今後、他の集約関数についても順次学習する。

このコースは、将来のデータアナリストのために多くの有用な関数を含んでいます。さまざまなデータ抽出方法を学び、条件を設定することもできます。その後、データのグループ化手法に精通することができます。また、データの前処理方法も学びます。各セクションには独自のデータセットが用意されているため、コースは魅力的なものとなっています。

このセクションでは、タイトルやインデックスによって特定の列を出力する方法を学びます。また、インデックスによって行を選択する方法についても理解を深めます。

ここでは、特定の条件を持つデータを抽出する方法を学びます。また、それらを組み合わせたり、自分自身で条件を作成したりする方法も学びます。

このセクションでは、さまざまなデータ条件の設定に関する知識を深めます。データが定義された値のリストに含まれているか、または2つの値の間にあるかを確認する方法を学びます。また、最大値と最小値を見つける方法についても学びます。

このセクションはコースの中でも特に興味深い内容の一つです。ここでは、データをさまざまな方法でグループ化する方法を学びます。特定のデータグループに関する情報を見つけるために、データアナリストとして役立つスキルを身につけることができます。

このセクションはデータアナリストにとって最も重要なものの一つです。なぜなら、データに不適切な形式の欠損値が含まれている場合、作業が不可能になるためです。したがって、ここではそのような不適切な値への対処方法を学びます。

DayOfWeek	Time
3	804.993130
4	804.452984
5	702.888362

GroupBy() メソッドに慣れる