• ベストアンサー

統計誤差について

例えば30000人の母集団の中から150人を ランダムに選んだ時の統計誤差の計算の仕方を教えてください。 母不良率が分かっている時は分かるのですが一般的に何人中何人調べたら 誤差は何%というのを計算できないのでしょうか? よろしくお願いします。

質問者が選んだベストアンサー

  • ベストアンサー
  • stomachman
  • ベストアンサー率57% (1014/1775)
回答No.1

母集団の大きさをk、サンプル数をn、サンプル中に含まれる不良の数がxとすれば、母集団に含まれる不良数がkpである確率はいくらか。 これは正確にはベイズ統計の問題です。というのも、母集団中に含まれる不良の数の分布に関する先験確率がない限り、確率が定義できないからです。ベイズ統計では、このような問題において、しばしば事前分布としてベータ分布(α、βが整数の場合なら2項分布) Beta(p|α,β) = {p^(α-1) } { (1-p)^(β-1) } Γ(α+β)/Γ(α)/Γ(β) (ただしkp = 母集団中に含まれる不良の数。Γはガンマ関数。αが整数の時には、Γ(α) = (α-1)!) を仮定します。ここでα、βは適当に選択して、Beta(p|α,β) がpの事前予想分布を表すようにします。これは勘に頼るのか、どうするのか、という問題はベイズ統計では面倒を見てくれません。 この仮定の下で、実際にn回の試行でx回の不良を見いだしたとすると、事後確率分布 Beta(p|x+α,n-x+β) = {p^(x+α-1) } { (1-p)^(n-x+β-1) } Γ(n+α+β)/Γ(x+α)/Γ(n-x+β) が得られる。Beta(p|x+α,n-x+β)はpのそれぞれの値における確信度を示します。 ベータ分布の場合、pの(平均値による)推定値は(x+α)/(n+α+β)です。信頼性a%の最高密度信頼性区間というものが計算でき、この区間にpが入る確率はa%と評価されます。 ベイズ統計に関する参考書は手許にありませんが、大きな図書館で探してください。多分HPもありそう。 ●他のアプローチもあるのかもしれません。

0115masa
質問者

お礼

大変参考になりました ありがとうございました

関連するQ&A