• 締切済み

的中率の確かさについて質問です。

確率・統計に詳しい方よろしくお願いします。 (当方、全くのド素人です。) 実はある競馬ソフトの的中率を検証したいと思っています。 販売会社はギャンブルではなく純粋な投資ソフトだとうたっています。 何をもって的中とするかですが、このソフトの場合1会場あたり(例えば中山競馬場など・・)12レースをすべて勝つまで馬券を買い続けます。1回でも勝てば目標金額に達するように設計されていますので1会場12レースあたり1回勝てば的中という考え方になります。 確かにここ2週間実際のレースで、4開催、12会場を検証したところ12会場すべて的中しているので的中率が高そうだという感触だけはあります。 ところが不的中だった場合は利益予定額の約10倍ほどの損失が出ます。 つまり10回的中その後1回不的中でほぼプラスマイナスゼロという感じです。 どの程度の利益が上がるのか、あるいは利益はでないのか? ・得られた利益の約1割は損失する。 ・得られた利益の約3割は損失する。 ・得られた利益の約7割は損失する。 ・得られた利益と損失はトントンである。 ・得られた利益より損失の方が5割大きい。 など感触を掴みたいのです。 つまり的中率というよりは不的中率を検証したいと思っています。 この投資ソフトは過去のレースデータでの検証ができるようになっています。 検証可能な過去の会場数は321会場です。 この全会場を検証した場合、的中率(不的中率)の確かさはプラスマイナス何%程度になるでしょうか? 200会場のみ検証した場合 100会場のみ検証した場合 40会場のみ検証した場合 の確かさはプラスマイナス何%と言えるでしょうか?

みんなの回答

  • Ishiwara
  • ベストアンサー率24% (462/1914)
回答No.2

クジには「宝くじ」型と「貧乏くじ」型があります(もちろん、その中間型もあります)。 前者は、参加者100万人が1円ずつ取られ、当たった1人が100万円もらいます。後者は、参加者100万人が1円ずつもらい、当たった1人が100万円取られます。 どちらも、期待値(無限回試行時の損益の平均)は同じです。あなたは、どちらに参加したいですか。これは「数学」ではなくて「計量心理学」の領域です。 あなたの問題は「貧乏くじ」型です。「勝ち/負け」の回数比率を取れば、あきらかにプラスでしょう。「勝ちの日が負けの日より多い」ことがあなたの最終目標なのであれば、この目標は叶えられるでしょう。 ただし、お金をもうけることが目標なのであれば、特にあなたが馬の調子を見抜く能力が他人より優れているのでない限り、数学的期待値は、ふつうの買い方の場合と同じです。 参照:サンクトペテルブルグのパラドックス

amaizoom
質問者

補足

回答ありがとうございます。 最終目標は「勝ちの日が負けの日より圧倒的に多い」ことです。 知りたかった事は無数の会場での的中・不的中データを集めた場合と有限データの差異です。サンプル数と確かさの関係を知りたかったのです。 因みに現在までに取れたデータは15日、45会場で1会場不的中がありました。サンプル数としては少なすぎるとは思うのですが、ここから計算をしてみます。(この計算をする事が目的です) 計算方法があっているかどうかも教えて頂けると幸いです。 的中率 :97.77% 不的中率: 2.22% ・1日3会場全的中の確率:93.5%  (的中率を3乗) ・3会場中1会場が不的中の確率:6.37%  (的中率×的中率×不的中率×3) ・3会場中2会場が不的中の確率:1.45%  (的中率×不的中率×不的中率×3) ・3会場全不的中の確率:約10万分の1  (不的中率を3乗) ・3会場中1会場不的中が連日(2回連続)起こる確率:0.41% (6.37%×6.37%) ・3会場中1会場不的中が3回連続起こる確率:0.03% (6.37%×6.37%×6.37%) となります。(計算方法はあっているでしょうか?) ただ、この計算の元となるデータ数が極端に少ないので的中率、不的中率の確かさがどの程度か知りたいのです。 プラスマイナスどの程度の誤差があるでしょうか? 計算方法も教えて頂けると嬉しいです。 サンプル数として 45会場 100会場 200会場 320会場 の場合はどうでしょうか?

すると、全ての回答が全文表示されます。
  • fatbowler
  • ベストアンサー率48% (26/54)
回答No.1

確率論では通常、期待値(期待金額)という考え方をします。 つまり利益(損失)が具体的に何円かを問題にしますが、 オッズに影響するほどの金額は掛けないでしょうから、 利益額の期待値は純粋に投資額に比例するでしょう。 1会場ごとに、利益額の合計を投資額の合計で割ったものを 仮に利益率と名付け、これの統計を取るのが妥当でしょうね。 何会場を検証したからどの程度確からしい、という定まった ものはありません。 データのバラつきに依存しますので、質問内容からは予想は 不可能です。 恐らく質問者の知りたいのは、無数のデータを集めたときの 結果との差異ではなく、例えば「平均5%の利益率」と出た 時に、おおよそ「0~10%」なのか「-50~60%」の意味なのか ということではないかと思います。 これはバラつきの程度であり、確率論的には標準偏差で 表されます。 データをExcelで整理するのが簡単でしょう。 C2セルからC101セルまでに上記の利益率が入っている とすると、C102セルに =SUM(C2:C101) C103セルに =STDEV(C2:C101) と入力して下さい。すると、C102に利益率の平均が、 C103に標準偏差が表示されます。 この2つの数字は、利益率の大半が、 C102±C103 の範囲に入る、ということを意味します。 つまり、次に試行したときに恐らくこの範囲に入る だろうと予測できるという訳です。 といったことで、回答になっているでしょうか。

amaizoom
質問者

補足

回答ありがとうございます。 意味を理解するのに時間がかかりお返事遅くなりました事、お詫びします。 このソフトでは期待値は目標金額という設定項目があり設定すれば目標金額を獲得するように毎レースごとに自動計算し自動購入するように設計されています。 目標金額をいくらにすると最大損失がいくら出るかは過去データで一瞬でシミュレーション出来るようになってますのでここも把握出来ています。 知りたかった事は無数の会場での的中・不的中データを集めた場合と有限データの差異です。サンプル数と確かさの関係を知りたかったのです。 因みに現在までに取れたデータは15日、45会場で1会場不的中がありました。サンプル数としては少なすぎるとは思うのですが、ここから計算をしてみます。(この計算をする事が目的です) 計算方法があっているかどうかも教えて頂けると幸いです。 的中率 :97.77% 不的中率: 2.22% ・1日3会場全的中の確率:93.5%  (的中率を3乗) ・3会場中1会場が不的中の確率:6.37%  (的中率×的中率×不的中率×3) ・3会場中2会場が不的中の確率:1.45%  (的中率×不的中率×不的中率×3) ・3会場全不的中の確率:約10万分の1  (不的中率を3乗) ・3会場中1会場不的中が連日(2回連続)起こる確率:0.41% (6.37%×6.37%) ・3会場中1会場不的中が3回連続起こる確率:0.03% (6.37%×6.37%×6.37%) となります。(計算方法はあっているでしょうか?) ただ、この計算の元となるデータ数が極端に少ないので的中率、不的中率の確かさがどの程度か知りたいのです。 プラスマイナスどの程度の誤差があるでしょうか? 計算方法も教えて頂けると嬉しいです。 サンプル数として 45会場 100会場 200会場 320会場 の場合はどうでしょうか?

すると、全ての回答が全文表示されます。

関連するQ&A