- 締切済み
あるコインの表が出る確率が1/2かどうか調べたいのですが、
あるコインの表が出る確率が1/2かどうか調べたいのですが、 このコインを10回投げて、表が8回出たとします。 統計のサイトを見て、危険率(棄却率?)というものがあるらしく、 これを10%で計算してみたのですが、 その際、表が8回出る確率だけでなく、9回、10回でる確率も加算して、 この10%に入っているか求めていました。 これはなぜでしょうか。 単に表が8回出る確率だけを使用してはだめなのでしょうか。
- みんなの回答 (5)
- 専門家の回答
みんなの回答
- Ishiwara
- ベストアンサー率24% (462/1914)
ANo.2です。 > 8回、9回、10回出るときの確率を全部足す理由がわかりません このような疑問を持たれるのは、まことにもっともなことですが、短いスペースでは説明しきれません。 簡単に言えば、帰無仮説が「このコインのオモテの確率は0.8である」ではなくて「0.8未満である」だからです。 もっと確実に理解するには、離散型分布(コインやサイコロ)よりも先に連続型分布(矢で的を射るような統計量)における検定を学習されることをお勧めします。 コインを1000回振って (1)オモテがちょうど600回出る (2)オモテが600回以上出る は、どちらも「確率」という概念で処理できるのですが、 矢を1000回放って (1)的の中心からちょうど20センチ外れる (2)的の中心から20センチ以上外れる の場合は、(1)は「確率密度」、(2)は「確率」とうい概念が適用されます。 矢の場合で(1)を確率で考えるとゼロになってしまいます。連続型では「確率」は「確率密度の積分」でないと扱えないのです。 コインに関して(1)を使って帰無仮説を立てると、確率が低すぎて、どんな場合も「高度に有意」となって棄却されてしまいます。 したがって、離散型分布で帰無仮説を立てるときには、連続型分布の場合に「倣(なら)って」確率は「無限大までの級数の和(連続型の積分に相当)」を使うことになっているのです。 「私が1000回振ると必ずオモテがちょうど600回出る」と主張した人がいて、それを否定するために帰無仮説を立てるなら、601回以上は足さなくていいのです。しかし、ふつうの場合は、帰無仮説は「このコインはオモテの確率が0.6以上ではない」ですから、601回~1000回の確率も足すことになります。
No.3では説明不足なので追加。 > 8回だけでも良いのではと思われるかもしれませんが、8回より起こりにくい9回10回がでたときに1/2と結論付けるこになってしまうため駄目です。 表が出る確率が1/2より大きい場合、表が出る確率が1/2の場合よりも9回10回が出やすいことも重要なことです。
お礼
解決しました。
補足
> 表が出る確率が1/2より大きい場合、表が出る確率が1/2の場合よりも9回10回が出やすいことも重要なことです。 もし、1/2よりも大きいのであれば、 表が出るか黒つが9回、10回のときだけでなく、 6回や7回のときも重要ではないですか? なぜ8回と、それより多い回数が出たのだけを足すのかよくわかりません。
そのあるコインの表がでる確率が1/2であったとします。 10回投げたとき表の出る回数の分布は 0 : 0.09765625% 1 : 0.97656250% 2 : 4.39453125% 3 : 11.71875000% 4 : 20.50781250% 5 : 24.60937500% 6 : 20.50781250% 7 : 11.71875000% 8 : 4.39453125% 9 : 0.97656250% 10 : 0.09765625% となり、表が5回の場合が一番でやすく、0回や10回が一番でにくいことがわかります。 実際にコインを投げて表がでる回数が滅多に出ない回数であったら、そのコインの表の出る確率は1/2ではないと結論付けるのが統計の検定です。 ではどこまでが滅多に出ない回数なのかということになりますが、ここで危険率が必要になります。 危険率とは、帰無仮説(この場合表の出る確率が1/2という仮説)が正しい場合、この仮説を棄却してしまう確率のことです。 つまり、危険率10%なら、表の出る確率が1/2であっても10%の確率で1/2ではないといってしまいますが、その間違いを許そうということです。 今回の場合、表の出る確率が1/2のとき8回以上表が出る確率は5.46875%で10%以下なのでOKですが、7回以上ですと17.1875%なので駄目です。 8回だけでも良いのではと思われるかもしれませんが、8回より起こりにくい9回10回がでたときに1/2と結論付けるこになってしまうため駄目です。 ただし、上の説明は片側検定の場合で、両側検定の場合は回数の少ない場合も足さないといけなくなります。
お礼
解決しました。
- Ishiwara
- ベストアンサー率24% (462/1914)
> 単に表が8回出る確率だけを使用してはだめなのでしょうか. だめです。 もし1000回振って、オモテが501回出たとします。 ちょうど501回出る確率は非常に低いですよね。その確率だけ使うと「そんなに確率の低いことが起きたのだから、このコインは怪しい」という結論になってしまいます。 ですから、501回、502回、503回‥‥1000回の確率を全部足して検定しなければいけないのです。
お礼
解決しました。
補足
> もし1000回振って、オモテが501回出たとします。 実際に計算してみました。 2.5%くらいでした。 これは小さな値なので、 ちょうど501回だけ出た確率で判断するのは、確かに間違っていると思います。 ですが、 > ですから、501回、502回、503回‥‥1000回の確率を全部足して検定しなければいけないのです。 ここがわかりません。 質問の内容に戻ると、 表がちょうど8回でる確率だけで判断するのは間違いだとしても、 8回、9回、10回出るときの確率を全部足す理由がわかりません。 表がちょうど8回出る確率が低いのは単に計算した結果であって、 8回~10回までを足す理由ではないと思います。 ちょうど8回出る確率が低いという理由で加算するのなら、 なぜその前後の7回と9回を足さないのでしょうか。 なぜ8回~10回を足すのでしょうか。
> 単に表が8回出る確率だけを使用してはだめなのでしょうか。 駄目です。 それですと、回数によっては表が出る回数がどんな値でも棄却されることになります。 ということで、帰無仮説が正しいときに表が8回出るよりも極端な場合の確率も加えましょう。
お礼
解決しました。
補足
> 帰無仮説が正しいときに表が8回出るよりも極端な場合の確率も加えましょう。 これはなぜですか? 単に8回表が出る確率が低いからですか?
お礼
解決しました。 他の場所で教えてもらえました。
補足
> 簡単に言えば、帰無仮説が「このコインのオモテの確率は0.8である」ではなくて「0.8未満である」だからです。 ここでの帰無仮説は確率が~未満である、ではなく、~である。だと思うのですが。 1/2というのは1/2以下でも1/2以上でも1/2未満でもなく、1/2なのです。 ただし、ちょうど1/2だけ表がでる、ではなく、表が出る確率が1/2です。 8回表が出る確率だけを使って、判断することはできないと思っていますが、 やっぱり9回と10回を足す理由がわかりません。 8回の確率だけで考えるとだめだからそれより多いのも足す、 というのは違うとおもっています。 結果の前に理論があると思うからです。 もう少し探してみます。