• ベストアンサー

[統計]「●●な人は△△ですか?」 必要な標本数は?

俺は統計は素人です。 よく人間関係カテゴリで見かける気がする 「背の低い人はダメですか?」 とかその他諸々。 自分はあまり回答を読みに行かないのだが、自分の経験から話す人が多く、実験やらソースやらを示している人は少ないんじゃないかと考えた。 もちろん、「人によって異なる」とか「誤差が出る」のだろうけど、「日本国民の90%以上の人についてはYESである」と明言するためにはアンケートで何人ぐらいの標本を採ればいいのだろう? 教えてgooのアンケートで回答する回答者にも偏りがあるだろうが、ここでは無視したいなぁ・・・ ======== うまく質問内容が伝わっているだろうか?

質問者が選んだベストアンサー

  • ベストアンサー
  • stomachman
  • ベストアンサー率57% (1014/1775)
回答No.3

 母集団である対象人口Nが小さい場合はイロイロ細かいことが出て来て難しくなりますんで、ここではNがすごく大きいとします。で、ある質問に「YES」と答える人がNp人(0≦p≦1)いるとします。  すると、このN人の中からランダムにM人を選んで同じ質問をしたとき、「YES」と答える人の数が丁度r人になる確率は二項分布 B(M,p,r) = combin(M,r) (p^r) ((1-p)^(M-r)) になります。平均は m= Mp, 分散は σ^2 = Mp(1-p) です。  さて、Mが大きいとき、B(M,p,r)は平均m,分散σ^2の正規分布で近似できます。従って、r/Mがm/M-ε~m/M+εの範囲に入る確率を例えば95%以上にしたければ、εM≒2σになるようにσを決めれば良い。一般にεM≒kσ(kは信頼度係数)とすると、 (εM)^2≒(k^2)Mp(1-p) だから、 M≒((k/ε)^2)p(1-p) となります。p=1/2のときにMは最大になって、 Mmax ≒ ((k/ε)^2)/4  ここでさらにk=2(95%の信頼度)に固定してみると、 Mmax(k=2) ≒ (1/ε)^2 ですから、例えばMmax(k=2)=1500とすると逆に、ε≒1/√1500≒1/40=2.5ポイントと分かります。つまり、「±2.5ポイント程度の誤差を許して、95%の信頼度なら1500人ぐらい」というコトです。(±2.5ポイントっていうのは、例えば、「YESと答える人が40~45%です」という時の幅である5の半分です。)  ところでご質問ではp=0.9ですから、 M≒0.09((k/ε)^2) k=2(95%の信頼度)にすると、誤差範囲±2.5ポイントなら600人ぐらい、±0.5ポイントなら14000人ぐらいってこってすね。もちろん、pがあらかじめ予想できていない場合には、最悪のケース、つまりp=0.5で調査対象人数Mを決めるしかありません。

noname#20377
質問者

お礼

#締め切ろうかなーと思っていたところでした。 ご回答有り難うございます なるほど、非常にわかりやすい解説をありがとうございます。14000人の調査を行わないとそれだけの精度が出ないんですね・・・ ±2.5%だと600人という少なさになるんですね! 意外です。教えてgooの回答数が確か400台だったから このくらいあれば参考になるのかもしれませんね。 重ねて、No.1,No.2さん含めありがとうございました。 #ちなみに別に会社の人間じゃないが、goo researchに関することでも述べて「オチ」を付けようかとか考えていた不謹慎な人間です(^^;;

その他の回答 (2)

  • age_momo
  • ベストアンサー率52% (327/622)
回答No.2

http://www.wound-treatment.jp/next/wound225.htm このあたりでどうでしょう。

  • yambejp
  • ベストアンサー率51% (3827/7415)
回答No.1

統計学的には1500人くらいだそうです。 もちろん、どこまで正確に無作為抽出ができるかにも よるでしょう。 googleアタリで「統計学 サンプリング」などで サーチするとヒットします

関連するQ&A