Notice: This page requires JavaScript to function properly.
Please enable JavaScript in your browser settings or update your browser.
学ぶ 条件付き確率とベイズの定理の理解 | 確率と統計
Pythonによるデータサイエンスのための数学

book条件付き確率とベイズの定理の理解

メニューを表示するにはスワイプしてください

条件付き確率

条件付き確率は、ある事象がすでに発生している場合に、別の事象が発生する確率を測定する指標。

公式:

P(AB)=P(AB)P(B)P(A \mid B) = \frac{P(A \cap B)}{P(B)}

ここで:

  • P(AB)P(A \mid B) は「Bが起きたときのAの確率」
  • P(AB)P(A \cap B) はAとBの両方が起きる確率
  • P(B)P(B) はBが起きる確率(0より大きい必要あり)

例1:条件付き確率 — 天気と交通

仮定:

  • 事象A:「仕事に遅刻する」
  • 事象B:「雨が降っている」

与えられている情報:

  • P(AB)=0.10P(A \cap B) = 0.10(雨が降り、かつ遅刻する確率は10%)
  • P(B)=0.20P(B) = 0.20(任意の日に雨が降る確率は20%)

このとき:

P(AB)=P(AB)P(B)=0.100.20=0.5P(A \mid B) = \frac{P(A \cap B)}{P(B)} = \frac{0.10}{0.20} = 0.5

解釈:
雨が降っている場合、仕事に遅刻する確率は50%。

ベイズの定理

ベイズの定理は、P(AB)P(A \mid B) を直接測定するのが難しい場合に、P(BA)P(B \mid A) を利用して求める方法。

公式:

P(AB)=P(BA)P(A)P(B)P(A \mid B) = \frac{P(B \mid A) \cdot P(A)}{P(B)}

ステップごとの解説

ステップ1: P(AB)P(A \mid B) の理解
これは「Bが起きたときのAの確率」と読む。

: A =「病気を持っている」、B =「陽性反応が出る」とすると、P(AB)P(A \mid B) は次の問いとなる:
陽性反応が出た場合、その人が実際に病気を持っている確率はどれくらいか?

ステップ2: 分子 = P(BA)P(A)P(B \mid A) \cdot P(A)

  • P(BA)P(B \mid A) = 病気を持っている場合に陽性反応が出る確率(検査の感度);
  • P(A)P(A) = Aの事前確率(病気の有病率)。

ステップ3: 分母 = P(B)P(B)
これはB(陽性反応が出る)が起きる全体の確率であり、真の陽性と偽陽性の両方を含む。

展開:

P(B)=P(BA)P(A)+P(B¬A)P(¬A)P(B) = P(B \mid A)P(A) + P(B \mid \neg A)P(\neg A)

ここで:

  • P(B¬A)P(B \mid \neg A) = 偽陽性率;
  • P(¬A)P(\neg A) = 病気を持っていない確率。

ベイズの定理 — 医療検査

仮定:

  • 事象A:「病気を持っている」
  • 事象B:「陽性反応が出る」

与えられた条件:

  • 病気の有病率: P(A)=0.01P(A) = 0.01
  • 感度: P(BA)=0.99P(B \mid A) = 0.99
  • 偽陽性率: P(B¬A)=0.05P(B \mid \neg A) = 0.05

ステップ1:陽性反応が出る全体の確率を計算

P(B)=(0.99)(0.01)+(0.05)(0.99)=0.0594P(B) = (0.99)(0.01) + (0.05)(0.99) = 0.0594

ステップ2:ベイズの定理を適用

P(AB)=0.990.010.05940.167P(A \mid B) = \frac{0.99 \cdot 0.01}{0.0594} \approx 0.167

解釈:
陽性反応が出ても、実際に病気を持っている確率は約16.7%にすぎない — これは病気がまれであり、偽陽性が存在するため。

主なポイント

  • 条件付き確率は、Bが起こったときにAが起こる確率を求める手法;
  • ベイズの定理は条件付き確率を逆転させ、直接測定が難しい場合に信念を更新する方法;
  • どちらの概念もデータサイエンス、機械学習、医療検査、意思決定に不可欠。
Note
注意

ベイズの定理は次のように考えることができる:「Bが起こったときのAの確率は、Aが真である場合にBが起こる確率にAが起こる確率を掛け、全体としてBが起こる確率で割ったもの。」

question mark

ベイズの定理が医療検査やスパムフィルタリングのような現実の問題で有用なのはなぜですか?

正しい答えを選んでください

すべて明確でしたか?

どのように改善できますか?

フィードバックありがとうございます!

セクション 5.  3

AIに質問する

expand

AIに質問する

ChatGPT

何でも質問するか、提案された質問の1つを試してチャットを始めてください

セクション 5.  3
some-alt