Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
学ぶ GroupBy() メソッドに慣れる | データの集約
Pandasによるデータ整形

bookGroupBy() メソッドに慣れる

メニューを表示するにはスワイプしてください

このセクションにお越しいただきありがとうございます。ここでは、データをグループ化して、さまざまなグループの行に関する情報を取得します。遅延に関するデータセットを確認してください(このテーブルは横にスクロールできます):

データのグループ化は有用であり、ここからさらに詳しく見ていきます。たとえば、各フライト番号ごとの遅延回数を計算したい場合を考えてみましょう。コード例とその説明を確認してください:

1234
import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/plane', index_col = 0) data_flights = data[['Flight', 'Delay']].groupby('Flight').sum() print(data_flights.head())
copy

説明:

data[['Flight', 'Delay']].groupby('Flight').sum()
  • data[['Flight', 'Delay']] - 操作対象の列。グループ化する列も含む;
  • groupby('Flight') - 'Flight' 関数の引数は .groupby() 列。同じ 'Flight' 値を持つ行がまとめられる;
  • .sum() - .groupby() で作成された各グループ内の行に対して動作する関数。この場合、同じ 'Delay' グループに属する行の 'Flight' 列の値を合計する。
Note
注記

'Delay' 列には 0(遅延なし)または 1(遅延あり)のみが含まれているため、行の合計は各フライトの遅延回数を表す。

実際、.sum() は利用できる集約関数のひとつに過ぎない。今後、すべての集約関数について学習する。

question-icon

'Time' カラムごとに 'DayOfWeek' カラムの平均値を求めるために空欄を埋めてください。

data_extracted = data[['', 'Time']]('').mean()
print(data_extracted)
DayOfWeekTime
3804.993130
4804.452984
5702.888362
すべて明確でしたか?

どのように改善できますか?

フィードバックありがとうございます!

セクション 4.  1

AIに質問する

expand

AIに質問する

ChatGPT

何でも質問するか、提案された質問の1つを試してチャットを始めてください

セクション 4.  1
some-alt