代表値と散布度の理解
メニューを表示するにはスワイプしてください
平均(アベレージ)
定義
平均とは、すべての値の合計を値の個数で割ったもの。データセットにおける**「中心」または「代表的」**な値を示す。
公式:
Mean=n∑xi例:
ウェブサイトの訪問者数が3日間で100、120、110人だった場合:
解釈:
平均して、1日あたり110人の訪問者があったことになる。
分散
定義
分散は、各値が平均からどれだけ離れているかを測定する指標。データがどれだけ**「広がっているか」**を示す。
公式:
σ2=n∑(xi−μ)2例(前述のデータを使用):
- 平均 = 110;
- (100−110)2=100;
- (120−110)2=100;
- (110−110)2=0。
合計 = 200
Variance=3200≈66.67解釈:
平均からの二乗距離の平均値は約66.67。
標準偏差
定義
標準偏差は分散の平方根。データの単位に戻して散らばりを示す指標。
公式:
σ=σ2例:
分散が66.67の場合:
解釈:
1日ごとの来訪者数は平均から約8.16離れている。
実世界の問題:ウェブサイトトラフィックの分析
問題:
データサイエンティストが5日間のウェブサイト訪問者数を記録:
ステップ1 — 平均値:
5120+150+130+170+140=142ステップ2 — 分散:
- (120−142)2=484;
- (150−142)2=64;
- (130−142)2=144;
- (170−142)2=784;
- (140−142)2=4.
ステップ3 — 標準偏差:
σ=296≈17.2結論:
- 平均値 = 1日あたり142人の訪問者;
- 分散 = 296;
- 標準偏差 = 17.2。
ウェブサイトのトラフィックは平均日から約17.2人の範囲で変動している。
すべて明確でしたか?
フィードバックありがとうございます!
セクション 5. 章 7
AIに質問する
AIに質問する
何でも質問するか、提案された質問の1つを試してチャットを始めてください
セクション 5. 章 7