- ベストアンサー
条件確率とベイズの定理
条件確率である P(A|B)=P(A∩B)/P(B) とは和訳するとどういう意味なのでしょうか? またベイズの定理の P(B|A)=P(A|B)×P(B)/P(A) もうまく理解できません…何か良い例はないでしょうか? 回答よろしくおねがいします。
- みんなの回答 (7)
- 専門家の回答
質問者が選んだベストアンサー
#4です。ちょっとだけ勉強してきました。 僕はいんちきコインを賭博師に提供する職人で、3種類のいんちきコインを製造しているものとします。 夫々表が出る確率は、 タイプA・・・1/4 タイプB・・・1/3 タイプC・・・2/3 とします。(裏が出る確率は、それぞれ1-表が出る確率) いま、タイプAを300枚、Bを100枚、Cを200枚造ったのですが、誤って全部混ぜてしまいました。(>_<) そこで今その中から一枚一枚とって、それがA,B,Cのどのタイプか、調べることにしました。見た目・重量などでは区別がつかない(極めて精巧)ので、何度か投げて、表が出る割合を調べることにしました。 と言っても顧客の賭博師たちに卸すまでに時間がありません。(ToT) 何千回何万回と実験すれば、ほぼ正確に分類できるでしょうが、 せいぜい一枚につき10回ずつしか、実験できません。 さていま、一つのコインをとり、10回投げて、表が4回出たとします。この事象をTとします。 ということは、今起きたのは、 (ア)取り出したコインがAであって、10回中表が4回出た。 (イ)コインがBであって、10回中表が4回出た。 (ウ)コインがCであって、10回中表が4回出た。 のどれかですね。 取り出したコインがタイプAである事前確率(実験する前に考えられる確率)P(A)は300/(300+100+200))=1/2で、 タイプAを10回投げて表が4回出る確率P(T|A)は、10C4{(1/4)^4}{(3/4)^6} ですね。 だから、一枚選んで10回投げたとき、(ア)となる確率は、このP(A)×P(T|A)で求まります。 同様に、 P(B)=1/6、P(T|B)=10C4{(1/3)^4}{(2/3)^6} P(C)=1/3、P(T|C)=10C4{(2/3)^4}{(1/3)^6} であり、 (イ)となる確率はP(B)P(T|B) (ウ)となる確率はP(C)P(T|C) で求まりますね。 ということは、Tが起きたとき、そのコインがAである確率は、 P(A|T)=P(A)P(T|A)/{P(A)P(T|A)+P(B)P(T|B)+P(C)P(T|C)} で計算できるわけですね。 ※分母は、イコールP(T)です。 そこで、計算機で計算すると、 P(A|T)=0.562 P(B|T)=0.292 P(C|T)=0.146 となり、このコインはきっとAだと推定できるわけです。 それであわてて分類して、無事売り抜けました。(さあ、失った信用はどの位でしょうか??) 素朴に考えると、4/10=0.4で、一番近いのはB、と考えてしまいますが、Bは枚数が少なく、Aは多いので、実はAである確率の方が大きくなるんですね。 とにかくこのように、たくさん実験できないときに推定をする際に、特に有用なようです。 長くなって済みません。
その他の回答 (6)
- mamirs3876
- ベストアンサー率42% (19/45)
これは#1さんの仰ってる例が1番分かりやすいでしょうね。「ベイズ統計学」となるとなかなか頭のいたい問題が出てきますが、「ベイズの定理」自体はそんなに問題にはならないとおもいます。#1さんの例をもう一度なぞってみます。 B:男子 ¬B:女子 計 A:眼鏡あり 10人 20人 30人 ¬A:眼鏡なし 30人 40人 70人 計 40人 60人 100人 一部変えてあるのは総計を100人、と付け足した事です。単にこれを使って計算してみればいいだけです。 P(A∩B)=男子の眼鏡クン/総数=10人/100人=10% まあ、これは簡単でしょう。 次に、P(A|B)×P(B)を見てみましょう。P(A|B)は「男子と言う条件の下での眼鏡クンの割合」です。ここの数値には女子は関係ありません。またP(B)は「全体の中での男子の割合」ですね。 P(A|B)×P(B)=眼鏡クンの数/男子の数×男子の数/総数=眼鏡クンの数/総数=10人/100人=10% はい。不思議な事に全く同じ数となりました。 次にP(B|A)×P(A)を調べてみます。P(B|A)は「眼鏡をかけてると言う条件の下での男子の割合」です。ここの数値には「眼鏡をかけてない」は関係ありません。またP(A)は「全体の中での眼鏡使用者の割合」ですね。 P(B|A)×P(A)=男子の数/眼鏡使用者の総数×眼鏡使用者の総数/総数=10人/30人×30人/100人=10% と全く同じ数が得られます。 従って、 P(A∩B)=P(A|B)×P(B)=P(A|B)×P(A) と言う関係が得られます。これがベイズの定理を導き出す前提です。 良くいわれるベイズの定理の応用では、「スパムメールフィルタ」と言うものがありますね。原理的には上のような判定法を用いています。 例えば「SEX」と言う単語が入ったメールを受け取る。そのメールがスパムか否か?と言う問題です。スパムだったら迷惑メールボックスに自動で突っ込んでほしい。そう言うプログラムを作りたい。 ベイズの定理を用いると、 P(スパムメール|SEX)=P(SEX|スパムメール)×P(スパムメール)/P(SEX) と記述できます。左辺は「SEXと言う単語を含んだ上でのスパムメールである確率」右辺は「SEXと言う単語を含みかつスパムメールである」確率を「SEXと言う単語を含むメールを受け取った確率」で割ればよい。重要なのは、分子のP(SEX|スパムメール)と言う部分で、これが示唆するのは「スパムメールのデータベースがあり、そのうちの何件がSEXと言う単語を含んでいる」情報さえあれば、そこからP(スパムメール|SEX)が予測出来る、と言う事です。コンピュータ上で解釈するには非常に便利な数式なんです。 例えば、 ¬B:ハム B:スパム 計 ¬A:SEXと言う単語ナシ 10通 20通 30通 A:SEXと言う単語アリ 30通 40通 70通 計 40通 60通 100通 なんてデータがあれば「SEXと言う単語が含まれている条件でのスパムである確率」は暫定的には計算が可能です(ハムメールとはスパムメールじゃない"通常の"メールの事を指します)。 こまかい部分のテクニックは色々とありますし、差はあります。例えば、実際は「たった一つの単語を使って」判定する事はあり得ず、複数の単語を使って判定します。また、P(スパムメール)を馬鹿正直に(上の例では)40/100と計算せず、適当な数値を使う場合もありますが、原理的には同じです。 この辺りは広義では「判別問題」といい、またスペシフィックには「テキスト分類問題」と呼びます。また、上のような「ベイズの定理」を使ったテクニックを「ナイーブベイズ分類法」等と呼びます。
お礼
詳しく説明していただき、ありがとうございます 具体例を用いると理解しやすいですね
- Ishiwara
- ベストアンサー率24% (462/1914)
#3です。ベイズの式の説明です。 数値例は、#1さんが示されたものを使わせていただきます。 この学校には、男子がP(B)=40/100の確率で入ってきます。そして、男子はP(A|B)=10/40の確率でメガネをかけます。女子はP(A|NotB)=20/60の確率でメガネをかけます。 生徒からランダムに1人を選んだところ、メガネをかけていることが判明しました。この人が男である確率は?というのが問題です。 実は、確率は、もともと「未来の事象」について述べるものであって「過去の事象」に関するものではありません。ここでは「男か女か」は過去の事実であって、すでに確定しており、単に解答者が「まだ知らない」だけの話です。このために「ベイズの定理」は、すべての数学者が納得しているものとは、なっていないのです。まだ「哲学的な」議論の余地を残しています(リンク先参照)。しかし、私たちは、このような必要にしばしば直面し、この定理を道具として便利に使っています。 ベイズの公式の発想は、(A(メガネ着用)となるすべての場合の確率)の中に占める(B(男子)を経由してA(メガネ)となる場合の確率)の割合が「メガネの生徒が男である確率」であって、次のように書くことができます。 P(B|A)=P(B)P(A|B)/(P(B)P(A|B)+P(NotB)P(A|NotB))----(1) 数値は、(2/5)(1/4)/((2/5)(1/3)+(3/5)(1/3))=1/3 この式を簡単にすると、 P(B|A)=P(A|B)(P(B)/P(A))----(2) 数値は、(1/4)((2/5)/(3/10))=1/3 (1)→(2) の証明は、省略しますが、やってみる価値はあります。 P(NotB) は1-P(B)に、P(A|NotB)) は P(A)-P(A|B) に置き換えられます。 しかしベン図を使うと、かなり直観的に、(1)と(2)が等しいことが分かります。
- tecchan22
- ベストアンサー率53% (41/76)
#2です。 確率はともかく、統計は「経験者」ではないのですが、 ベイズの定理の式自体は確率論的にはほとんど自明(少なくとも、簡単に証明できる)ですが、それを統計学に用いて、非常によい「推定」の方法を、ベイズさんが考えたということでしょう? ですから、式の意味よりも、「どのように用いるのか」が重要で、それが分からないと、ベイズの定理の有用性は分からないはずです。 そこは、統計の経験者・専門家が現れて、説明して下さるのを期待しましょう。(僕には無理です、ごめんなさい) だけど、それは種々の本、またHPにも書いてあることですから、それを自分で勉強されて、分かられなければ、また質問するという様にした方がいいと思います。 応用の仕方が分かれば、式自体の意味は自然に分かると思いますよ。 ※素人考えで言えば、P(B|A)とP(A|B)と、右辺と左辺でA,Bが入れ替わっているのがきっとポイントで、P(B|A)の値を統計的に推定したいとき、それが直接は難しいが、P(A|B)を統計的に推定することは可能なときに、用いるということでしょうね。具体例はちょっと思いつきませんが。経験者さんよろしく。
- Ishiwara
- ベストアンサー率24% (462/1914)
ベイズの定理の意味・記述が理解できないのか、それとも、式(1)から式(2)を導くことができないのか、ちょっとハッキリしません。 式を導くだけならば、(1)を(2)に代入することで、容易にできそうですが。
補足
式の導き方は分るのですが、 どういう意味なのか、またどういう使い方をするのかが理解できないのです
- tecchan22
- ベストアンサー率53% (41/76)
全体事象をBに制限する、ということです。 全体事象をBに制限したときの、Aの確率(Aがおきる確率)は、 P(A∩B)/P(B) になるでしょう? 分からなければ、図を描いて考えてみて下さい。 言葉を変えれば、「Bが起きるときの、Aが起きる確率」です。 ベイズの定理の意味は、条件付確率の意味が分かった上で、考えてみて下さい。
お礼
全事象をBに制限するというのは分りやすいですね 回答ありがとうございます<m(__)m>
- ymmasayan
- ベストアンサー率30% (2593/8599)
例だけ説明します。 良く使われるのが性別と眼鏡の関係です。 A事象・・眼鏡をかけている B事象・・男子 B:男子 ¬B:女子 計 A:眼鏡あり 10人 20人 30人 ¬A:眼鏡なし 30人 40人 70人 計 40人 60人 とします。 > P(A|B)=P(A∩B)/P(B)とは和訳するとどういう意味なのでしょうか? P(A|B):B事象が発生したときのA事象、つまり10/40=25%です。 P(A∩B):A事象とB事象が同時に起こるので10%です。 P(B):B事象の確率=40/100=40%です。 > またベイズの定理のP(B|A)=P(A|B)×P(B)/P(A)もうまく理解できません P(B|A):A事象中のB事象ですから10/30=33% P(A|B):先ほどの25%です。 P(B):B事象=40/100=40% P(A):A事象=30/100=30% これで式が理解できたら式の証明に挑戦してみてください。
お礼
簡単な例をありがとうございます。 証明してみます
お礼
回答ありがとうございました。 頑張ってさらに理解を深めようと思います