supernova20102のプロフィール

@supernova20102 supernova20102
ありがとう数3
質問数0
回答数4
ベストアンサー数
3
ベストアンサー率
100%
お礼率
0%

  • 登録日2013/07/24
  • 性別女性
  • 職業フリーター
  • 年代100歳以上
  • 都道府県群馬県
  • コインの表裏の出る回数の差がm回以下になる確率

    某先進国の地方選挙や大統領選挙で、例えば100000票の中のわずか200票の差で勝敗が決したことが現実にあります。日本の選挙でもありましたね。率にすると得票数の0.5%以下が決め手になったケースが。 そこで、こうした選挙などをモデル化して、何%くらいでありえることなのか、 真剣に検証したいと思います。 タイトルではあえてコインの表裏に例えました。カードを落とした時に表が出るか裏が出るか、でも良いです。とにかく選挙でA候補に入れるかB候補に入れるかが完全に2分の1で独立、だとします。実際の選挙だと勝ち馬に乗りたがったり劣勢の候補を応援したくなったりいろいろですが、無視してください。無効票もないものとします。 反復試行回数n回 とするとき、Aの票が出る 回数がk回 とすると(回数と言ったり票と言ったり読みにくかったらすみません。カードでも選挙でもどちらでも良いです)、 二項定理より、Aの票が出る回数がk回となる確率 Q(n,k)=nCk(1/2)^n ですよね? すると、 Aの票が出る回数がBの票が出る回数よりm回多い とした場合、その確率P(n,m)は、 以下の4通りに場合分けして出した答えで合っていますでしょうか? 【質問1】 1)nが偶数、すなわちn=2jとおけて、 mも偶数、すなわちm=2iとおけるとき(jは自然数、iは 0≦i≦j の整数) (同票数の場合もAが勝ったと見なす) P(n,m)=R(j,m) =Q(2j,j)+Q(2j,j+1)+Q(2j,j+2)+・・・+Q(2j,j+m) =(2jCj+2jC(j+1)+2jC(j+2)+・・・+2jC(j+m/2))/(2^(2j)) 2)nが偶数、すなわちn=2jとおけて、 mが奇数、すなわちm=2i-1とおけるとき P(n,m)=0 3)nが奇数、すなわちn=2j-1とおけて、 mが偶数、すなわちm=2iとおけるとき P(n,m)=0 4)nが奇数、すなわちn=2j-1とおけて、 mも奇数、すなわちm=2i-1とおけるとき (j=1の場合は考える必要なし) P(n,m)=R(j,m) =Q(2j-1,j)+Q(2j-1,j+1)+Q(2j-1,j+2)+・・・+Q(2j-1,j+m) =((2j-1)Cj+(2j-1)C(j+1)+(2j-1)C(j+2)+・・・+(2j-1)C(j+(m+1)/2))/(2^(2j-1)) 具体的に、 総票数100000票、 A 50100票 B 49900票 得票数差 200票 かそれ以下 となる確率 P(100000,200)は (100000C50000+100000C50001+100000C50002+・・・+100000C50099+100000C50100)/2^100000 で合っていますか?【質問2】 (Σ記号も理解はできますが、書きにくいので無しで書きました。) (n,mについての関数なのに、私の式ではnを使わずにjを使っていて、間違いだったらすみません。表現はおまかせします。) そこでこれに伴って質問です。 【質問3】 もっと簡単な式はありますか? 【質問4】 10C6などは私も手計算できますが、100000C50000 になると無理です。何か参考になるサイトはあるでしょうか。 【質問5】 2^100000 などについて何か参考になるサイトはあるでしょうか。 【質問6】 ずばり P(100000,200)はいくつくらいになるのでしょう。 P(1000,200) P(10000,200) P(100000,200) は次第に小さくなる傾向にありますか?(それが自然と思います) それは直線的にP(n,m)の nの値に比例するのでしょうか。 【質問7】 私はデータ分析や標準分布については弱いです。 でも ○○の確率で 100000回の試行回数なら差が何百回以下に収まるはずだ、というようなよく言われる用語があるのでしょうか。 【質問8】 一般的に、表も裏も出るのが等確率になるのなら、 100000回のうち50000回ちょうど表が出る という事象は、 「もっともありがちな事象」 であって、珍しいことでも何でもない、 のでしょうか? 選挙でこういうことがあると(確か日本のどこかの村で30050票と29950票のような僅差の勝利がありましたね)、それがどれくらい数学で見て奇跡的なのか、興味を持たずにはいられません。 ご助言よろしくお願いします。

  • 統計学、何検定を使えばいいですか?

    統計学初心者です。 正常ラットと飢餓ラットの臓器の重量や長さを統計処理し、有意差があることを示したいのですが、何検定を使えばいいのか分かりません。 カイ2乗検定かとも思いましたが、違うような気がします。 何検定を使えばいいですか?教えてください、お願いします。

  • 生データなしのロット間ばらつきの計算

    ロット間ばらつきを計算したいです。 各ロットには20000個ほどのサンプルがあり、各ロットの平均値とσがわかっている状態です。 このロットが30ロットほどあり、30ロット全体の平均値と標準偏差が計算したいです。 現場のソフトの都合上生データを取り出すにはかなり手間がかかるので、各ロットのσで計算出来ればよいのですが可能でしょうか。 平均値は30ロットの平均の相加平均で計算できますが、標準偏差は可能でしょうか。 よろしくお願いします。

  • Rというソフトの最小2乗法の結果について困ってます

    Rの出力結果で、「○○e+03」とは○○の10^3の、「○○e-02」とは10^-2の意味。というのは分かったのですが、どうやら有効桁数も示しているらしいのです。たとえば「3.03 e+05」の有効数字は3桁で、解答として出す際は303,000という表記で出すらしいのですが、なぜ3桁になるのか分かりません。 例えば、 出力結果が、           Estimate    Std. Error    t value    Pr(>|t|)           (Intercept)   -1.142e+05    3.668e+04   -3.115    0.00422 **           可処分所得   8.958e-01   1.724e-02    51.947   < 2e-16 *** のとき、 -1.142e+05なら-114,200と、8.958e-01なら0.8958として、 C_i=-114,200+0.8958Y_i という推定式で良いのでしょうか? あと、ついでなのですが、Pr(>|t|)の下の数値の横にある「**」や、「***」は何か意味があるのでしょうか?