GroupBy() メソッドに慣れる
メニューを表示するにはスワイプしてください
このセクションにお越しいただきありがとうございます。ここでは、データをグループ化して、さまざまなグループの行に関する情報を取得します。遅延に関するデータセットを確認してください(このテーブルは横にスクロールできます):
データのグループ化は有用であり、ここからさらに詳しく見ていきます。たとえば、各フライト番号ごとの遅延回数を計算したい場合を考えてみましょう。コード例とその説明を確認してください:
1234import pandas as pd data = pd.read_csv('https://codefinity-content-media.s3.eu-west-1.amazonaws.com/4bf24830-59ba-4418-969b-aaf8117d522e/plane', index_col = 0) data_flights = data[['Flight', 'Delay']].groupby('Flight').sum() print(data_flights.head())
説明:
data[['Flight', 'Delay']].groupby('Flight').sum()
data[['Flight', 'Delay']]- 操作対象の列。グループ化する列も含む;groupby('Flight')-'Flight'関数の引数は.groupby()列。同じ'Flight'値を持つ行がまとめられる;.sum()-.groupby()で作成された各グループ内の行に対して動作する関数。この場合、同じ'Delay'グループに属する行の'Flight'列の値を合計する。
注記
'Delay' 列には 0(遅延なし)または 1(遅延あり)のみが含まれているため、行の合計は各フライトの遅延回数を表す。
実際、.sum() は利用できる集約関数のひとつに過ぎない。今後、すべての集約関数について学習する。
すべて明確でしたか?
フィードバックありがとうございます!
セクション 4. 章 1
AIに質問する
AIに質問する
何でも質問するか、提案された質問の1つを試してチャットを始めてください
セクション 4. 章 1