- ベストアンサー
統計学の基礎について【素人です。理論を教えてください】
私はド素人です。 あるアンケートをとった時、25人中20人がYESでした。80パーセント。 2500人中2000人がYESでも、同じ80パーセントですよね? 統計の信頼性とか精度は、私みたいなド素人が考えても、 母数が大きい「2500人アンケート」の方が、より確かだと思うんですが、「25人にとるアンケート」と、「2500人にとるアンケート」。 信頼幅というか、、、なんというのでしょうか、、、25人にとったアンケートが信頼し難い理由を、統計学の理論から説明してください。 御願いします。 (単に母数がでかい方がいい、という理屈ではなく)
- みんなの回答 (3)
- 専門家の回答
質問者が選んだベストアンサー
中学や高校の確率的な話にしてみます。 例えば、8000万個の青い玉と2000万個の赤い玉が箱に入っていたとします。(日本国民1億人をイメージしてみました) ■25個玉を取り出す場合 青い玉が何個出るかとその確率は以下の通り。 10個:0.00115% 11個:0.00627% 12個:0.02938% 13個:0.11710% 14個:0.40149% 15個:1.17769% 16個:2.94424% 17個:6.23486% 18個:11.0842% 19個:16.3346% 20個:19.6015% 21個:18.6681% 22個:13.5768% 23個:7.08355% 24個:2.36118% 25個:0.37779% 本来の確率である80%近辺の78~82%の間という結果が出るのは19.6%程度しかありません。そして、全部が青い玉であると判定してしまう確率も0.378%程あります ■250個玉を取り出した場合 78%~82%の間である196個~205個青い玉が出る確率は以下の通り。 196個:5.03097% 197個:5.51619% 198個:5.90622% 199個:6.17334% 200個:6.29680% 201個:6.26548% 202個:6.07937% 203個:5.74995% 204個:5.29897% 205個:4.75615% ・・・ 250個:0.00000....... 196個~205個の合計は57.0734% この場合に本来の確率である80%の近辺である78%~82%という結果が得られる可能性は57%にもなります。 しかも全部が青い玉と判定してしまう確率はほぼ0%です。(0.003777893の10乗!!) このようにサンプルの数を増やすと本来のその母集団の正しい割合に近い数字が出やすくなります。 上は25個と250個での差ですが、2500個にすればより精度が高まります。
その他の回答 (2)
- Ishiwara
- ベストアンサー率24% (462/1914)
ひょっとして、あなたは「25人のほうが信頼区間が大きい」という説明にとまどっているのでは、ありませんか。 「信頼区間が大きい」ということは、「真の値がどこにあるのか漠然としている」ということで「データの信用度合いが低い」という意味です。データの数が多いほど「信頼区間は小さく」なり、ついには「真の値」に集約され「動かし難い」結論となるわけです。
お礼
ご回答有難う御座いました。
- FEX2053
- ベストアンサー率37% (7991/21371)
推計学の仮説検定の手法から考えるだと思いますが。 http://ja.wikipedia.org/wiki/%E6%8E%A8%E8%A8%88%E7%B5%B1%E8%A8%88%E5%AD%A6 要は、80パーセントという値が、母集団に対してどれだけ「確からしさ」を 持っているかと言う問題になります。当然標本数が少なければ「確からしさ」 も減るわけで、その辺を数学的にゴニョゴニョすると、ああした複雑な式に なるんです。
お礼
ご回答有難う御座いました。 この式が理解できません><
お礼
ご回答有難う御座いました。