「化学シリーズ」が長く続いてしまったので、気分を変えて「統計シリーズ」です。
統計は私の専門分野の1つなのでいろいろと書けるのですが、
需要自体がなさそうなのと、趣味のブログでまで関わりたくないという理由で避け続けていました。
今回は『条件付き確率とは?ー具体例と”ベイズの定理・ベイズ推定”』として、
統計を勉強していない方のほとんどが誤解している「条件付き確率」についてわかりやすく解説します。
時間があれば、別の記事でギャンブルの期待値などのお話もしようと思います。
いずれにしても、まずは基礎となる「確率」について興味を持っていただけることを目標に書いていきますね。
スポンサーリンク
条件付き確率とは?/具体例・ベイズの定理・ベイズ推定
条件付き確率とは?
条件付き確率というのは、ある条件(事前情報)が加わったときの確率のことです。
言葉にすると難しく感じるかもしれませんが、単純に状況が変わったから確率も変わるというだけのことです。
簡単な具体例を出してみましょう。
例えば、冷蔵庫にジュースとデザートが1つずつだけ入っているとします。
喉が渇いたのでジュースを飲みたいのですが、
適当に冷蔵庫に手を突っ込んでジュースを取り出す確率は50%ですね(…どんな状況かはわかりませんが)。
すなわち、条件がない状態では「ジュースを取り出せる確率は50%(=1/2)」です。
このとき、運悪くデザートの方を取ってしまったとしましょう。
すると冷蔵庫の中身はもうジュースだけなので、
次に100%(=1)ジュースを取ることができます(補足ですが「%」という記号は1/100という意味です)。
実はこれこそが「条件付き確率」そのものです。
つまり、「冷蔵庫にもうデザートが入っていない」という条件が与えられたことにより「ジュースを取り出せる確率」が変動しました。
まとめると、「条件付き確率」とはある条件下での確率だといえますね。
では、極端な具体例はやめにして、身近で起こる誤解されがちな条件付き確率を紹介していきましょう。
スポンサーリンク
子供が女の子である確率はホントに50%?(具体例)
まずは基本的なことから。
2人子供が生まれたとして、その子供がともに女の子である確率はいくつでしょうか?
※ ただし、子供の性別は男、女の2種類とし、ともに1/2の確率で生まれるとします。
正解は25%(=1/4)ですね。
この辺は大丈夫だと思いますが、たまに1/3と回答する方がいます。
これは、性別に注目するあまりに、個体の区別をしていないことが原因です。
確かに性別だけをみれば、子供2人の性別の組み合わせは
女ー女、女ー男、男ー男 の3種類です。
高校レベルの確率問題までは共通することですが、面倒くさくても事象をすべて区別して具体的に数えることが大切です。
この場合は、1番目の子供と2番目の子供をきちんと区別しましょう。
そうすると、
① 女ー② 女、① 女ー② 男、① 男ー② 女、① 男ー② 男 の4つの組み合わせがあったことが分かります。
したがって、ともに女の子である確率は、25%(=1/4)だとわかりますね。
さて、脱線してしまいましたが、次からが本題です。
2人の子供のうち、1人は女の子だということがわかりました。
このとき、2人の子供がともに女の子である確率はいくつでしょうか?
正解は1/2 ……ではなく1/3です。
「1人は女の子」という条件が加わることで、もはや直観による確率は適用できません。
具体的に組み合わせをみていきましょう。
「1人は女の子」であるため、男ー男の組み合わせだけが存在しないことになります。
もうおわかりだと思いますが、組み合わせは、
① 女ー② 女、① 女ー② 男、① 男ー② 女 の3種類で、ともに女の子となるのは
① 女ー② 女 のときだけなので1/3の確率ですね。
もし第一子が女の子だという条件も加わった場合には、1/2の確率ですね。
今回は子供を例にとりましたが、ポーカーなどのギャンブルにも広く適用可能です。
カードゲームを例にとれば、自分から見えるカード(=条件)が多くなるほど、次に引くカードの予想(=確率)がつきやすくなりますよね。
特にブラックジャックの計算は単純なので、確率を読むことで期待値が計算できます。
この辺はまた別の記事で書いていきますね。
身近な条件付き確率とベイズの定理・ベイズ推定
以上のように、条件を加味して計算した確率が「条件付き確率」です。
言い換えると、「条件を付加していくことによってより正確な予測が可能となる」とも表現できますね。
条件付き確率は日常生活でも大活躍していて、
例を挙げればキリがないほどですが、迷惑メールフィルターがわかりやすいと思います。
迷惑メールフィルターでは、メール1つ1つにつき中身の単語をリストアップしていって、
その単語の危険度からメールの信用度を決めています。
つまり、迷惑メールにありがちな「無料」や「出会い」などの単語(=条件)が多ければ、
そのメールは迷惑メールである確率が高いと判断しているのです。
フィルターの強度(低・中・高)は、どこまで迷惑メールである確率を許容するかに相当しています。
フィルターの強度が低い場合では、”迷惑メールである確率が50%以下の場合は、迷惑メールに分類しない”などですね。
このフィルターの場合でも、「迷惑メールにありがちな単語」が1つ増えるごとに「迷惑メールである確率」は毎回変動していきます。
以上のように、条件が変わるたびに計算をやり直して確率を求め直す予測方法が、
統計学では非常に有名な「ベイズ推定」という方法です。
統計用語で表現すると、未知のパラメータに関する事前の知識(事前分布)が、
知識を獲得することにより変わる変化(事後分布)をとらえているということです。
説明を続けていくと小難しくなっていくので、今回はこの辺にしておきます。
次回は、条件付き確率の延長である「モンティ・ホール問題」をご紹介します。
「モンティ・ホール問題」はアメリカのゲーム番組で紹介されたクイズで、
今回紹介した「条件付き確率」を理解していないと理屈を説明してもなかなか理解してもらえないおもしろいゲームです。
ここまで、読んでいただけた方なら容易に理解できるはずなので、ぜひ次の記事もご一読ください<(_ _)>
以上、『条件付き確率とは?ー具体例と”ベイズの定理・ベイズ推定”』でした!
最後までお読みいただき、ありがとうございました<(_ _)>
「条件付き確率ー具体例とベイズの定理・ベイズ推定」まとめ
条件付き確率
・ 条件付き確率というのは、ある条件が加わったときの確率のこと
子供が女の子である確率はホントに50%?(具体例)
Q.2人の子供のうち、1人は女の子である場合、2人の子供がともに女の子である確率はいくつか?
A.1/3
「1人は女の子」であるため、男ー男の組み合わせが存在しないことになる。
よって、組み合わせは、① 女ー② 女、① 女ー② 男、① 男ー② 女 の3種類で1/3の確率。
・ 条件付き確率は、ポーカーやブラックジャックといったギャンブルにも広く適用可能
身近な条件付き確率とベイズの定理・ベイズ推定
・ 迷惑メールフィルターでは、メールの単語情報をもとに、迷惑メールである確率を求める
・ このように、条件が変わるたびに計算をやり直して確率を求め直す予測方法が「ベイズ推定」
・ ベイズ統計(推定)では、未知のパラメータに関する事前の知識(事前分布)が知識を獲得することにより変わる変化(事後分布)をとらえている