- ベストアンサー
条件つき確率(?)の計算
ある容器に無数のコインが入っている。 それらのコインは、投げたとき表が出る確率(p)が必ずしも1/2ではなく、全くでたらめである。(p=0からp=1まで一様に分布している) この容器からでたらめに一枚のコインを取り出し、n回投げたところ、そのうち表が出たのはr回であった。 このコインをさらにもう一度投げるとき、表が出る確率はいくらか。 という問題なのですが、まったく分かりません。 考え方を(手間でなければ解答も)教えてください。
- みんなの回答 (5)
- 専門家の回答
質問者が選んだベストアンサー
>「このコインをさらにもう一度投げるとき、表が出る確率」ではなく、「このコインのp」ではないですか? その二つは、同じものです。 「このコインのp」の値が x であるとき、「このコインをさらにもう一度投げるとき、表が出る確率」も x で、 したがって、「n回投げたところ、そのうち表が出たのはr回であった」確率は、(nCr)・x^r・(1-x)^(n-r) です。 その p が、ある確率分布に従う確率変数である訳ですが、 p の確率分布は、無条件であれば、「p=0からp=1まで一様に分布している」。これが、p の事前確率分布です。 その中から、「n回投げたところ、そのうち表が出たのはr回であった」p だけを選ぶように条件を加えれば、 この条件下での p の確率分布は、最初のものとは異なります。これが、p の事後確率分布です。 事後確率分布の確率密度関数が、求めるべき f(x) です。 > 私には、これこそが求める解であると感じられます。 >(そうでなかったとしても、私は別途その実数の正体を知りたいです) 貴方が求めようとしているものは、「表が出る確率」でなくて、「表が出る確率」の期待値にすり替わっています。 その値も興味深いものですが、「表が出る確率はいくらか」と問われたら、要求されているものは違うと思います。 クドイようですが、「表が出る確率」は、それ自体が、ある確率分布に従う確率変数なので、1個の実数値としては 求まりません。 > あるpをもつコインをn回投げてr回表が出る確率 = nCr(n,r)・p^r・(1-p)^(n-r)が関係していそうだと感じました。 事象 A と事象 B があるとき、A が起こる確率を P[A]、(A かつ B) という事象が起こる確率を P[A∧B]、 A が起こったという条件下に B が起こる確率を P[B|A] と書くと、P[A∧B] = P[A]・P[B|A] という関係があります。 ここで、A =「確率変数 p の値が x になる」、B =「n回投げたところ、そのうち表が出たのはr回であった」とすると、 P[B|A] = (nCr)・x^r・(1-x)^(n-r) です。問題が要求しているものは、f(x) = P[A|B] です。 一般に、P[B|A] と P[A|B] の関係を扱う技法を「ベイズ統計」と言います。
その他の回答 (4)
- arrysthmia
- ベストアンサー率38% (442/1154)
No.3への補足 ←微妙ですが、たぶん違います。 「求める解 = ∫[0,1] q(x)・dx ÷ 1」としたのでは、 依然として、一つの実数値を求めようとしているでしょう? No.3で述べたことは、 「このコインをさらにもう一度投げるとき、表が出る確率」は、 1個の確定値ではなく、それ自体が確率変数だから、 値を求めようとすることは無意味で、替わりに、 その確率の確率密度関数を求めなければならない ということです。 要するに、f(x) が求めるべき解だ と言っているのです。 「r/n は、確率変数 q の期待値です。」と書いたのは、 ∫x f(x) dx = r/n だ という意味です。 質問のタイトルに「条件付確率」とありますが、 これは、正にベイズ統計・条件付確率の問題です。 p の事前確率分布が「p=0からp=1まで一様に分布」であって、 「n回投げたところ、そのうち表が出たのはr回であった。」が観測されたとき、 その条件下での p の事後確率分布を求めよ と問われているのです。
補足
待ってください。全く恐れ多いのですが、説明の一部に違和感があります。 もしかすると、arrysthmiaさんがおっしゃっている確率変数qは、 「このコインをさらにもう一度投げるとき、表が出る確率」ではなく、「このコインのp」ではないですか? > 「このコインをさらにもう一度投げるとき、表が出る確率」は、 > 1個の確定値ではなく、それ自体が確率変数だから、 > 値を求めようとすることは無意味で、替わりに、 これが、「このコインのpは1個の確定値ではなく~」であれば、私は違和感なく受け入れることができます。 実際に問題の行為をN回行ってみて、そのうち何回のn+1投目が表であったかをRとすれば、Nを増やすにつれて、R/Nは何かひとつの実数に近づいて行く筈です。 私には、これこそが求める解であると感じられます。 (そうでなかったとしても、私は別途その実数の正体を知りたいです) … それはそれとして、qの確率密度関数についてですが、 あるpをもつコインをn回投げてr回表が出る確率 = nCr(n,r)・p^r・(1-p)^(n-r)が関係していそうだと感じました。 この方向は正しいですか?
- arrysthmia
- ベストアンサー率38% (442/1154)
p が確定した値でなく、一様分布に従う確率変数ですから、 「このコインをさらにもう一度投げるとき、表が出る確率」q も 確定した一つの値ではなく、ある確率分布に従う確率変数になります。 r/n は、確率変数 q の期待値です。 q の確率密度関数を求めることは、可能ですが…。 以上の説明が何を言っているのか、理解できたなら、 補足に返信をどうぞ。確率密度を求めるためのヒントを書きます。
補足
n回投げてr回表が出たコインのpがxである確率をf(x)とすれば q(x) = x・f(x) であり、 求める解 = ∫[0,1] q(x)・dx ÷ 1 だから、 問題の核心はこのf(x)を求めることである、という認識であってますでしょうか?
- opechorse
- ベストアンサー率23% (435/1855)
もっと単純に 分母 いままでn回投げた数 分子 そのうち表が出た数 r →今までの確率r/n 次の1投 今までの確率で表が出るだろうから r/n・・・答え です 確率の定義は n回繰り返し試行したとき、対象の事象がr回おこる→r/n 一般的なコインのように 表と裏が出る確率が均等ならば 対象となる事象の数(コイン:1つ)÷すべての事象の数(コイン:2つ) ですが 今回の問題のような場合 それが分からないので、定義に戻って試行を繰り返したと考えます
補足
そうなると、例えば、1回投げて1回表が出たコインの2投目が表である確率が1/1となるのは変ではないですか? 0回投げて0回表が出たコインの1投目が表である確率は明らかに1/2である筈ですし。
- opechorse
- ベストアンサー率23% (435/1855)
課題丸投げは禁止なのですが 方針として まず確率とは何か、今回の問題に関して表が出る確率の分母は何か?分子は何か? これが分かればというか問題文に書いてありますが おのずと分かります
補足
確率=「ある条件をみたす事象の総数/起こりうる全ての事象の総数」 という感じでしょうか...となると、 分母=「n回投げてr回表が出たコインをもう一度投げる試行を繰り返した回数」 分子=「n回投げてr回表が出たコインをもう一度投げる試行を<分母>回繰り返したとき、そのうち表が出た回数」 ですかね? 整理してはみましたが、やはりよく分かりません。
お礼
しばらく無為をしていましたが、先ほど閃きがあり、ようやく分かりました。 1. f(x,n,r) = nCr * x^r * (1-x)^(n-r) は、確率密度関数の相対的形状を示す 2. 確率密度関数の総和は1であるはずだから、確率密度関数は、g(x,n,r) = f(x,n,r) / ∫[0,1](f(x,n,r) * dx) 3. また、以上より、pの期待値は ∫[0,1](x * g(x,n,r) * dx) 念のため、実際に計算で確認を行ってみましたが、やはり正しいようです。 arrysthmiaさんの丁寧な先導のおかげで、自分で止めを刺すことができました。とてもいい気持ちです。 心からお礼を申し上げます。 P.S: 最後の数式は、見た目の重厚さに反して、私が試した全ての(n,r)について (r+1)/(n+2) というシンプルな値を返しました。不思議な式です。