ベストアンサー

統計学の基礎について【素人です。理論を教えてください】

2008/09/24 15:45

私はド素人です。あるアンケートをとった時、２５人中２０人がＹＥＳでした。８０パーセント。２５００人中２０００人がＹＥＳでも、同じ８０パーセントですよね？統計の信頼性とか精度は、私みたいなド素人が考えても、母数が大きい「２５００人アンケート」の方が、より確かだと思うんですが、「２５人にとるアンケート」と、「２５００人にとるアンケート」。信頼幅というか、、、なんというのでしょうか、、、２５人にとったアンケートが信頼し難い理由を、統計学の理論から説明してください。御願いします。（単に母数がでかい方がいい、という理屈ではなく）

kamiya0987
お礼率96% (575/597)

数学・算数
回答数3
ありがとう数3

みんなの回答 （3）
専門家の回答

質問者が選んだベストアンサー

ベストアンサー

ryuken_dec
ベストアンサー率27% (853/3139)

2008/09/24 22:06 回答No.2

中学や高校の確率的な話にしてみます。例えば、8000万個の青い玉と2000万個の赤い玉が箱に入っていたとします。(日本国民１億人をイメージしてみました) ■25個玉を取り出す場合青い玉が何個出るかとその確率は以下の通り。 10個：0.00115% 11個：0.00627% 12個：0.02938% 13個：0.11710% 14個：0.40149% 15個：1.17769% 16個：2.94424% 17個：6.23486% 18個：11.0842% 19個：16.3346% 20個：19.6015% 21個：18.6681% 22個：13.5768% 23個：7.08355% 24個：2.36118% 25個：0.37779% 本来の確率である80%近辺の78～82%の間という結果が出るのは19.6%程度しかありません。そして、全部が青い玉であると判定してしまう確率も0.378%程あります ■250個玉を取り出した場合 78%～82%の間である196個～205個青い玉が出る確率は以下の通り。 196個：5.03097% 197個：5.51619% 198個：5.90622% 199個：6.17334% 200個：6.29680% 201個：6.26548% 202個：6.07937% 203個：5.74995% 204個：5.29897% 205個：4.75615% ・・・ 250個：0.00000....... 196個～205個の合計は57.0734% この場合に本来の確率である80%の近辺である78%～82%という結果が得られる可能性は57%にもなります。しかも全部が青い玉と判定してしまう確率はほぼ0%です。(0.003777893の10乗！！) このようにサンプルの数を増やすと本来のその母集団の正しい割合に近い数字が出やすくなります。上は25個と250個での差ですが、2500個にすればより精度が高まります。

質問者

お礼 2008/09/30 10:53

ご回答有難う御座いました。

その他の回答 (2)

Ishiwara
ベストアンサー率24% (462/1914)

2008/09/25 13:11 回答No.3

ひょっとして、あなたは「２５人のほうが信頼区間が大きい」という説明にとまどっているのでは、ありませんか。「信頼区間が大きい」ということは、「真の値がどこにあるのか漠然としている」ということで「データの信用度合いが低い」という意味です。データの数が多いほど「信頼区間は小さく」なり、ついには「真の値」に集約され「動かし難い」結論となるわけです。

質問者

お礼 2008/09/30 10:54

ご回答有難う御座いました。

FEX2053
ベストアンサー率37% (7991/21371)

2008/09/24 17:10 回答No.1

推計学の仮説検定の手法から考えるだと思いますが。 http://ja.wikipedia.org/wiki/%E6%8E%A8%E8%A8%88%E7%B5%B1%E8%A8%88%E5%AD%A6 要は、80パーセントという値が、母集団に対してどれだけ「確からしさ」を持っているかと言う問題になります。当然標本数が少なければ「確からしさ」も減るわけで、その辺を数学的にゴニョゴニョすると、ああした複雑な式になるんです。