• ベストアンサー

二項分布の成功確率を求める方法(再々)

度々、お世話になっております。 先日、以下のような2項分布において成功確率が未知である時の求め方を教えていただきました。 成功確率:0.01 試行回数:200回 以上の二項分布は以下のようになります。 試行  0 1 2 3 4 5 ... 分布 0.1340 0.2707 0.2720 0.1814 0.0902 0.03572 ... 今回は前回の派生になるかと思います。 試行5回における分布の累積は上記結果から0.983977です。 あるいは期待値は1.898284です。 それでは逆に、この結果、すなわち試行5回までの分布情報から成功確率を求めることが可能でしょうか(成功確率が未知と言うことです)? 最終的に何をしたいのかと言うと試行5回においてある基準値(累積値)を設定した場合の成功確率を求めたいのです。

質問者が選んだベストアンサー

  • ベストアンサー
noname#227064
noname#227064
回答No.4

> ”p=”の式に変換できるでしょうか? コンピュータで数値計算を行って求めるしかないと思います。 ご質問の例についてNo.3の求め方で成功確率を実際に計算してみます。 ソフトウェアは色々あると思いますが、以下は統計ソフトR(Rについては参考URLを参照)での計算例です。 > r <- c(0.1340, 0.2707, 0.2720, 0.1814, 0.0902, 0.03572) # 相対度数 > L <- function(p) prod((dbinom(0:5, 200, p))^r)*(1-pbinom(5, 200, p))^(1-sum(r)) # 尤度関数 > optimize(f = L, interval = c(0, 1), maximum = TRUE) # 最大化 $maximum [1] 0.009988102 $objective [1] 0.1847092 となり、成功確率は0.009988102と計算されました。

参考URL:
http://www.r-project.org/, http://cse.naro.affrc.go.jp/takezawa/r-tips/r.html
sano018463
質問者

お礼

どうもありがとうございました。 おかげで助かりました。 まだ統計ソフトRの使い方を十分に習得できていませんがいろいろ試してみます。 ありがとございました。

すると、全ての回答が全文表示されます。

その他の回答 (3)

noname#227064
noname#227064
回答No.3

「試行5回・・・」という書き方をされていますが、これは「成功回数」のことで、5回だけデータをとるということではないですよね? 成功回数が6回以上のデータは、値がわからない或いは用いたくないので、5回までのデータから成功確率を求めたいのですよね? そうだとして回答します。 > すなわち少ない試行で判断をするためには統計的(不偏が成立している)には実際の値(ここだと成功確率=0.01)より必然的に小さい値になると言うことですね? 当然、大きい値を捨てているのですから、小さい値になります。 最尤推定法による求め方を書いておきます。 成功確率p、試行回数200回の二項分布からn個の標本を得た。 成功回数0~mまでの度数がf0~fmで、m+1以上の度数はわからないとします。 このときの尤度関数は、 L = nC(Σfi)*{1-F(m,200,p)}^(n-Σfi)*Π{200Ck*p^k*(1-p)^(200-k)}^fk となります。ここで、Cはコンビネーション、F(m,200,p)は成功回数mまでの分布関数です。 このLを最大にするpが、求める成功確率の最尤推定量となります。 nやfiがわからず、相対度数r0~rmしかわかっていないのならば、 {1-F(m,200,p)}^(1-Σri)*Π{p^k*(1-p)^(200-k)}^rk が最大になるようなpを求めれば良いでしょう。

sano018463
質問者

補足

解答ありがとうございます。 ここ数日、考え込んでいたので返信が遅くなりました。 頂いた解答についての考え方は理解できるのですがここをどう解いていくとpが求められるのかと言う解法が出てきません。 ”p=”の式に変換できるでしょうか? 改めてお教え願えますか?

すると、全ての回答が全文表示されます。
  • Ishiwara
  • ベストアンサー率24% (462/1914)
回答No.2

#1です。 > 少ない試行で判断をするためには‥‥実際の値より必然的に小さい値になると言うことですね? そんなことはありません。「不偏」という以上、1個のデータを採る時の推定値は、分布の平均そのものであって、大小の偏りはありません。 ただし(だまされやすいのは)分布の形が非対称である場合です。結果の「回数」を考えると、平均よりも小さいデータが出てくる確率が高いと言えます。また、非対称でなくても「平均より込んでいるバスに乗る確率」のほうが「平均よりすいているバスに乗る確率」よりも大きい、というパラドックスもあります。 99本のハズレくじと、1本の当たりくじ(賞金100万円)があるとき、賞金の不偏推定値(期待値)は1万円です。しかし、現実に「人数に注目すれば」ハズレを引く人が圧倒的に多いわけです。 だからと言って「少数サンプルでは値が低く出やすい」とは、言えません。運良く1本目で100万円を当てる確率が厳然としてあるわけですから、数学上の不偏推定値は、あくまで1万円です。 ただし、このような例は、行動科学や計量心理学の研究対象ともなっており、数理統計学や確率論だけが人間を支配しているとも言えません。「聖ペテルブルグのパラドックス」なども研究されてはいかがでしょうか。

sano018463
質問者

お礼

どうもありがとうございます。 なかなか統計は奥深いものですね。 正確には工程管理のために活用しようとしていますが理論を理解していないと意味が通じなくなる可能性があることを思い知らされました。 もう少し勉強してみます。

すると、全ての回答が全文表示されます。
  • Ishiwara
  • ベストアンサー率24% (462/1914)
回答No.1

平均値(1.898284)を200で割った値(0.00949142)が成功確率の「不偏推定値」です。

sano018463
質問者

補足

どうもありがとうございます。 もう少し確認させてください。 すなわち少ない試行で判断をするためには統計的(不偏が成立している)には実際の値(ここだと成功確率=0.01)より必然的に小さい値になると言うことですね? 単純な逆算ではいけないと言うことですね?

すると、全ての回答が全文表示されます。

関連するQ&A