- 締切済み
120分の1の確率。何回くらいのサンプルがあれば信用出来る??
こんにちは。 賭け事は全くしないのですが、先日フと、「確率論だけで、競艇(家の近くにあるんで^^)に勝つことは出来ないか??なんて思いまして。 複勝とか単勝とか色々あるようなのですが、その中の「三連単」を選びました。 「三連単」とは1、2、3位を順位共にズバリ当てるものです。 競艇は1号艇から6号艇までの6艇で競争し、競馬の様に1枠に2頭以上いたりしないので、枠が重複することはなく、組み合わせは120通りになります。 その組み合わせの中で、120分の1以上の出目があり、ソレを買い続ければ勝てるかも?というお馬鹿な事を調べたくて^^実際には配当金などが絡むので一筋縄ではいきませんが、あくまで出目の確率の話としておねがいします。 120分の1と言っても、120回に1回必ず出るわけではない事は分かっています。 そこで質問なのですが・・・。 1レースに6艇出走するレースを何レース位調べれば、ある程度信用出来るデータになるのでしょうか? 相当なサンプル数になりそうな予感はしていますが、なにせ、確率とかはサッパリ詳しくなくて・・。 どなたかご存じの方お教え下さい。 よろしくお願い致します。
- みんなの回答 (3)
- 専門家の回答
みんなの回答
- stomachman
- ベストアンサー率57% (1014/1775)
120通りの組み合わせのうちのひとつ(たとえば(1,2,3))が当たりになる確率をpとします。データをいっぱい取って 帰無仮説H: 「p=1/120である」 を棄却することが出来たとすると、 p=(1+ε)/120, ε≠0 が言えるでしょう。 だたし、これはあくまでも、取ったデータだけから言える事は何か、という話。未来の予測に使えるためには、データを取ったときの条件が未来においても変化しないことが必要です。例えば「データを取ったときにはインを取ったらほぼ必勝のすんごい強い選手がいたんだけど、近頃引退しちゃった」「データを取ったときはずーっと気温が高かったが、このごろは冷えるねえ」なんてことが起こりうる訳で。ま、それはさておき「取ったデータだけから言える事」の話に戻りますと… 帰無仮説Hに従えば、N回観察したときに(1,2,3)が丁度k回現れる確率は B(N,p,k) = combin(N,k) (p^k) ((1-p)^(N-k)) ここに、p^kは「pのk乗」、combin(N,k)は「N個の中からk個を選ぶやり方の数」です。B(N,p,k)は二項分布と呼ばれ、平均m=Np=N/120、分散σ^2 = Np(1-p)=119N/14400 です。そして、二項分布はNが大きいとき、平均m、分散σ^2の正規分布で近似できます。 だから例えば(1,2,3)の出現回数がmより多くて、しかも、この正規分布のうんと裾野の方にあたる、ということがもし生じたとすると、帰無仮説Hを(ある危険率のもとで)棄却することができます。 危険率というのは「帰無仮説Hを棄却するのが間違いである確率」のことです。これを2.5%以下に抑えることにしますと、「裾野の方にあたる」というのは、「正規分布の平均mよりも2σ以上多い」ということ。 だから、N回観察したとき、(1,2,3)の出現回数がm+2σ以上であれば、帰無仮説Hは(2.5%の危険率で)棄却できる。 棄却できたとしましょう。ということは、観察した(1,2,3)の出現回数がN回中N(1+ε)/120であったとすると、 2σ<Nε/120 となったから棄却できた訳です。σ^2 = 119N/14400 を代入して整理すると N>238/(ε^2) だから、「N回観察したところ、1/120よりも当たりやすい組み合わせが(2.5%の危険率で)見つかった!」と言えるためには、N>238/(ε^2) という条件を満たしていなくてはなりません。この条件を満たしていない場合は、「観察回数が少ないために、偶然のばらつきのせいで、当たりやすいように見えただけ」という可能性があるわけです。 例えば、「ある組み合わせは ε=1 (1/120の2倍も当たる!)」という現象が観察できたとしても、それが238回以上の観察の結果でなくては、信用できない。 また、「ある組み合わせは ε=0.1(1/120の1.1倍当たる!)」という現象が観察できたとしても、それが23800回以上の観察の結果でなくては、信用できない。 てな具合です。 ついでに、 > 120分の1と言っても、120回に1回必ず出るわけではない事は分かっています。 仰る通りで、1/120で当たるものを120回繰り返したのに一度も当たらない、ということが起こる確率は1/e≒37%もあります。
- kaduno
- ベストアンサー率21% (130/592)
確率論は毎回の条件が同じであってはじめて成立するものなので、毎回の条件が異なる場合には当てはまらないです。 順位の組み合わせが120通りあるとはいっても、その確立は120分の1ではないので、サンプル数云々以前の問題です。
- X-trail_00
- ベストアンサー率30% (438/1430)
120通りの組み合わせ で各組み合わせの率を求める場合。 少なくとも数倍、多ければ多いほど確度は上がるかな。 各組み合わせに差がつかないと意味が無いので 1万レースほどサンプルを取れば見えてくるでしょう。 というか競艇なら内枠有利とか4コース有利とか 競艇場によって変わります。 (大体は1コースの勝率が高いのでしょうが。) そっちを調べた方が確実。 モータの勝率*選手の勝率*コース毎の勝率 こちらを研究された方が・・・