- 締切済み
信頼度から必要な試行回数を求める方法について
前回の質問の続きです. http://okwave.jp/qa4620701.html たとえば,AがB,Cどちらかになる確率は不明のとき 試行回数が1000回の時に A→B になった回数が570回 A→Cになった回数が430回であったとき 誤差が「±5%である」といえる信頼度が90%になる時の試行回数は何回か を求める方法を教えていただけないでしょうか.
- みんなの回答 (7)
- 専門家の回答
みんなの回答
- arrysthmia
- ベストアンサー率38% (442/1154)
> 誤差が「±5%である」といえる信頼度が90%になる時の試行回数は何回か は、「誤差」が何の誤差なのか 意味の取りにくい書き方ですが、 前質問 http://okwave.jp/qa4620701.html の補足に > 1.AがBになる確率は52%~62%(結果の±5%)であるといえる信頼度は何%なのか > 2.また,「±5%のである」といえる信頼度が90%になる時の試行回数は何回か と書いてありました。 No.5 で求めているのは、 「A→B になった回数」を 570 と推定することの誤差が±5%のである信頼度が 90% になる試行回数 です。1000 回試行した標本平均を推定した誤差について考えていることになります。 上記補足を読むと、質問の内容は、 「A→B になる確率」を 570/1000 と推定することの誤差が±5%のである信頼度が 90% になる試行回数 であるように思えます。母平均を推定した誤差について考えているのであろうということです。 この二つは、No.7 に >「成功」確率がpである2項分布であれば、 > n回の試行で得られる「成功」回数の分布が正確な2項分布にはなりません。 >「n回の試行」をワンセットにして無限回くりかえして重ね合わせれば、2項分布に収束します。 とあるとおり、全く別のことなので、区別が必要です。 後者の意味では、「A→B になる確率」p の事前確率密度を μ(p) として、 n 回の試行で「A→B になった回数」k が与えられた際の p の事後確率密度は、 ρ(p) = { (nCk)(p^k)(1-p)^(n-k)・μ(p) } / ∫[p=0~1] (nCk)(p^k)(1-p)^(n-k)・μ(p) dp です。 補足の質問 2. は、k/n = 570/1000 のとき、∫[p=0.52~0.62] ρ(p) dp = 0.90 となる n を訊ねていることになります。 μ(p) が与えられていなければ計算できないし、そもそも p を確率変数と考えてよいのか? さえ 質問文の記述からは明らかでない… ということを、No.3 では書いてみたつもりです。
- jaspachate
- ベストアンサー率60% (32/53)
補足しておきます。 「信頼度」は confidence level ( あるいは場合によっては confidence value ) の訳語であり、他に 「信頼水準」「信頼係数」「信頼率」等が使われます。使われる分野によって偏りがあるかもしれませんが、慣習的にconfidence lebel であることがわかれば良いので「~と呼ぶはず」と言った決まりはありません。 それよりはむしろ「信頼区間 confidence interval」「信頼限界 confidence limit」の方は訳語が確定しています。 また、「信頼度」を 1-α と書くとき、α を significance level「有意水準」あるいは「危険率」とよび、区間推定のもとになる考え方である「帰無仮説」における仮説検定の境界を表します。 http://ocw.tsukuba.ac.jp/25a0ii-2-56fd969b7dcf54085b66985e/7d718a0879d15b66/8b1b7fa916 http://aoki2.si.gunma-u.ac.jp/Yogoshu/84.html http://aoki2.si.gunma-u.ac.jp/lecture/Suitei/kukansuitei.html http://next1.cc.it-hiroshima.ac.jp/MULTIMEDIA/statistics/node10.html http://www.tamagaki.com/math/Statistics502.html さて質問者様の問題文からは、失礼ながら確率統計に関する知識にあやふやさが見られると推察します。そこで、区間推定に関する次のURLを参照なさることをお勧めします。また上にあげたURLの中にも参照できるものがあります。 http://oku.edu.mie-u.ac.jp/~okumura/stat/tests_and_CI.html これらは ベイズ推定以前の古典的な統計手法による推定方法です。例えば「成功」確率が p である2項分布であれば、n回の試行で得られる「成功」回数の分布が正確な2項分布にはなりません。「n回の試行」をワンセットにして無限回くりかえして重ね合わせれば、2項分布に収束します。パラメータである確率p、や平均値np、標準偏差np(1-p)などは、「n回の試行」ごとに変動します。これが統計変動であり、ある確率分布に従います。この事実に基づいてあるパラメータの推定値 p が得られたときにその信頼性を議論するのが有意水準や信頼区間の考え方であり、「誤差」の考えももともとそれに基づいています。 質問者様の質問は明らかにそのような統計変動にまつわる推定について行われたと考えられるので、まずは古典的な区間推定の方法をNo.5回答で提示しました。
- cametan_42
- ベストアンサー率62% (165/265)
これ言うの気が引けるんですが……。一応書いておきます。 まずは落ち着いて元々の問題 http://okwave.jp/qa4620701.html を読んでください。 1-αは(統計学の用語って事実上、コンセンサスが得られてない場合があるとは思いますが)「信頼係数」って呼ぶ筈です。「信頼度」じゃない。あわてて計算始める前に質問者の意図するところ、あるいは「考え」見た方が良いです。彼は「信頼度」を「信頼係数」の意味で使っているのか?恐らくそうじゃないんですよ。全然違う事を尋ねている。 基本的に僕は#3のarrysthmiaさんの意見に賛成で「データの出方を問うている」のでなく、既にデータは所与の状況として「パラメータの推定」に付いて質問者が尋ねている、と思っています。そこが実はハッキリしないんですが(笑)。 そうすると、下手すれば確率変数はデータの方じゃないんですよ。パラメータ自体が「分布する」可能性がある、と言う大変危うい事を質問されているんじゃないのか、って思っています。 これかなり難しい範疇なんで、出来れば回答者の方々はオリジナルの質問を注意深く読んでください。標本理論的には「質問者の勘違いだ」で終わる可能性さえあると思います(そうじゃない可能性もまたありますが)。
- jaspachate
- ベストアンサー率60% (32/53)
「ある処理を行うとx%でAがBになり,(100-x)%でAがCになる場合(xは未知)」 と言う問題ですね。ここで、p=100x、つまりpを「AがBになる」確率とします。 もし1回ごとの試行でpが一定であればベルヌーイ試行であり、n回の試行でBが x回実現する確率は二項分布で表されます。題意から、Aは必ずBかCになることがわかるので、あとは p を一定と仮定します。もしpが1回ごとに、あるいは n回の試行中に様々な要因で変化するのであれば、一つの二項分布で表すことはできません。 二項分布は、 P(n;x) = C[n,x]p^x(1-p)^(n-x)、[0≦x≦n] Σ[x=0~n] P(n;x) = 1 xの平均値 <x> = np xの分散 σ^2 = np(1-p) xの標準偏差 σ = √[np(1-p)] p の推定値 p = <x>/n p の推定値の標準偏差 σ/n これは、nが大きければ平均<x>、標準偏差σの正規分布で近似できます。pが0か1に近いほど n を大きくしないといけませんが、概ね n>100 ならば良い近似になります。n=1000なら問題ないでしょう。 正規分布では、信頼度1-αのときの信頼区間を <x>-δ≦x≦<x>+δ とすれば、標準的な Neyman の区間推定法を用いて、 1-α = erf(δ/(σ√2)) 正規分布は対称形なので、これは x-δ≦<x>≦x+δ の信頼度でもあります。これから、 δ = √2σ erf~(1-α) です。ここで erf は誤差関数と呼ばれる関数で、erf~()はその逆関数、 erf(x) = (2/π)∫[0、x]e^(-t^2)dt さて、x が観測され、誤差が±100β% (±5% なら β=0.05) であれば、 δ = βx = √2σerf~(1-α) ここで、x=np、σ=√{np(1-p)} から、 σ/x = √{(1-p)/np} = √{(1-x/n)/x} = β/{√2 erf~(1-α)} これから n を求めると、 n = x / [ 1 - x{β/(√2erf~(1-α))}^2 ] = x/(1-x(σ/x)^2) あるいは、x=np ゆえ、x のかわりに p を用いると、 n = (1-p) / [ p{β/(√2erf~(1-α))}^2 ] これが 信頼度1-αでの信頼区間 x-βx≦<x>≦x+βx を得るための試行回数を表します。 1-α=90%、のときは様々な統計書や数表から、 erf~(0.9) = 1.64/√2 なので、δ=1.64σです。ゆえにβ=0.05 のとき 1.64σ = 0.05x、 n = x/(1-(0.05/1.64)^2x) = 1212.3 (x=570) となります。 試行回数 n が小さいとき n << 100 のときは正規分布の近似が悪くなり、二項分布は非対称形になるので、二項分布の関数形を直接用いて区間推定法を用いなければなりません。その計算ではF分布を用いるので、計算はやや複雑になります。以下のURL等や、専門書を参照してください。 http://www.ec.kagawa-u.ac.jp/~hori/delphistat/binom.html http://actuary.upthx.net/pukiwiki/index.php?1.1.2.2.5.F%CA%AC%C9%DB%A4%CB%BD%BE%A4%A6%C5%FD%B7%D7%CE%CC
- cametan_42
- ベストアンサー率62% (165/265)
>>#3のarrysthmiaさん。 僕もそう思ったんですよね(笑)。下手すれば「ベイズ統計」の文脈だろ、と直感的に思いました。 ただ、質問者の人が「数学不得手」って書いてたんで、そこまで議論広げていいのかどうか……。大体「OKWave/教えて!goo」で回答出来るようなネタかどうか全然自信無かったです(笑)。 まあ、質問者が尤度の概念が分かるかどうか、って辺りでしょうねえ。
- arrysthmia
- ベストアンサー率38% (442/1154)
# 前回質問のほうに回答しておきました。 根本的なところに、勘違いがありそうです。 「AがB,Cどちらかになる確率」が確率変数であるのかどうか、 もう一度、考え直してみましょう。 その確率を確率変数とみなすためには、何か仮定を追加する 必要があると思います。
前回の質問を拝見しましたが、求め方は既に書かれているようですが何がわからないのでしょうか? 前回の回答者にも指摘されていると思いますが、ご自分がどう考え、どこまでやったかを記載していただかないと丸投げと受け取られますので、補足にどこがわからなかったのか記載してください。
補足
質問投稿日時と回答日時を見ていただけるとわかると思うのですが. 前回sanoriさんに二回目にご回答をいただいてからsanoriさんのご回答にあったように新規に質問をする必要があると思い新規に質問をしました. その後,sanoriさんが前回の質問の方に2の質問についてもご回答をいただけたので解決に至りました. わからなかった部分に関しては sanoriさんのご回答の >>つまり、目標の信頼度を得るための試行回数の決定のためには、 >>まず最初に、何回か試行しなくてはいけないんですね。 >>(そもそも、ある程度試行しなければ、pの値さえも未知だということもありますが。) この部分の考え方でした. 確かに,自分がどう考え,どこまでやったかを記載していなかったのは私の不備ですが