- 締切済み
統計学的に信頼できるサンプル数
統計の勉強をしておりましたらサンプルの抽出方法が下記に書いてありました。 http://www.wound-treatment.jp/next/wound225.htm ここでは、10万人の世論調査をする場合2000人必要とのこと。 実際数式に数字を当てはめてみると10万人を超える集団になると 1500人を調査すれば傾向を把握できるということがわかりました。 ここからが疑問なのですが、 「地域別の男女の傾向を把握」したいという調査があるとします。 (東北、関東、四国・・・・のそれぞれ男女別) 東北の人数も、関東の人数も四国の男女別人口はそれぞれ10万人を超えております。 すると、 東北の男性:1500人 女性:1500人 関東の男性:1500人 女性:1500人 四国の男性:1500人 女性:1500人 ・ ・ ・ という調査数でよいのでしょうか?? 最終的にその選んだサンプル数の全数で、「男女別の傾向」も 出したいと思っております。 普通に考えると、 人口が多い関東は、人口の少ない四国と同じサンプル数でいいのかという疑問があります。 同じ数だと、全国の傾向を出したいのに 人数の少ない四国と関東が同じであれば、四国の意見傾向にひきづられるような気がします。 そうすると調査人口は変えたほうがいいのでしょうか? (四国を500人 500人にして、関東を2500人 2500人にするなど) そうして人数を変えてしまうと そもそもの、10万人の調査は1500人が必要だという統計上の件数に基づかないので 関東の人口をたとえば4000人に増やすのでしょうか? それとも、世論調査は2000人あればいいということで 2000人を人口比率で四国・関東・・・・の男女別に割り振ればいいのでしょうか。 よろしくお願いいたします。
- みんなの回答 (1)
- 専門家の回答
みんなの回答
- Akira_Oji
- ベストアンサー率57% (45/78)
サンプリングの数の最小値は、それだけあれば母集団の傾向を把握できる数ですから、それ以上サンプリングの数を増やしてもあまり結果を改良できない。 >10万人を超える集団になると >1500人を調査すれば傾向を把握できるということがわかりました。 であれば、母集団が各地域の男女ですから、 >東北の人数も、関東の人数も四国の男女別人口はそれぞれ10万人を超えております。 >すると、 >東北の男性:1500人 女性:1500人 >関東の男性:1500人 女性:1500人 >四国の男性:1500人 女性:1500人 などなど それでいいと思います。 >普通に考えると、 >人口が多い関東は、人口の少ない四国と同じサンプル数でいいのかという疑問があります。 >四国を500人 500人にして、関東を2500人 2500人にするなど にすると四国は「サンプリングの数の最小値」を満たしていません。(計算していないので、分りませんが、500人が最小値より小さければ)一方、関東は「サンプリングの数の最小値」を満たしていますが不必要な1000人分の調査費用を無駄に使っていることになります。 一律のサンプリング数にしたければ、各地域の男女の人口から、サンプリングの数の最小値を計算し、その中の最小値プラスアルファできりのいいかずを選べばいいわけでしょう。
お礼
ご回答ありがとうございます。 確かにサンプリングの件数を増やしすぎても調査費用が無駄にかかってしまいますね。 今回は統計の勉強中に疑問に思ったことを書いてみましたが ご丁寧にご回答いただきありがとうございました。 人数が多くても少なくても同じ人数でいいというのは意外でした。