• 締切済み

サンプル数の決定

こんばんは、皆さん。 ある製品を買ったユーザに対してアンケートを取ることを考えています。 アンケートが例えば5段階で次のようになっているとします。 ・たいへん使いやすい ・使いやすい ・普通 ・使いにくい ・とても使いにくい これを母集団(製品を購入した人)の姿を反映している結果を得たい場合、 何人からの有効回答が得られなければならないのでしょうか? 当然、完全に妥当であるかどうかは確率論になると思いますので、 条件として信頼度が95%以上であるという場合、どのように考えたら よいのでしょうか?

みんなの回答

  • solla
  • ベストアンサー率59% (45/76)
回答No.3

> これを母集団(製品を購入した人)の姿を反映している結果を得たい場合、 > 何人からの有効回答が得られなければならないのでしょうか? サンプルが母集団を反映したものになっているかどうかはサンプル数とは関係なく、サンプルの抽出が正しくランダム化(無作為化)されているかどうかで決まります。ランダム化が適切に行われていない、偏ったサンプルになっていればどんなに数が多くても誤った結果しか出てきません。偏った多数のサンプルよりも適切にランダム化された少数のサンプルの方が良いこともあります。 極端な例ですが、日本人全体について調べるために1万人にアンケートを実施したとします。1万人といえば“超”大規模調査です。しかしこのアンケートの対象の90%が20歳代の男性だったとしたら、この“超”大規模調査から日本人全体について何か言えるでしょうか? サンプルの抽出が適切な方法で無作為に行われ、母集団を適切に反映している事を保障した上で、次の段階として必要な推定の精度を確保するためにサンプル数はどの位かを考える事になります。 ↓こちらの質問に対する私の回答も参考になるかと思います。 http://okwave.jp/kotaeru.php3?q=1552827

noname#17299
質問者

補足

ご回答ありがとうございます。同じ質問があったんですね。 ひととおり検索しましたが発見できませんでした。 リンク先の質問の人が記載したリンクも読みましたが、何が何だかわかりませんでした。 サンプルの抽出が正しくなければ意味がないのはもちろんわかります。 サンプルがランダムに抽出されていて、製品を購入した人が1万人いると仮定して、5段階評価のアンケートを取った時、これだけの回答がもらえれば、アンケートの結果を1万人の意見として捉えることができるのでしょうか? また、N/( ( (E/k)^2 * ( (N-1) / P(100-P) ) +1 )の式がどのように導かれたのか、この式はどういう統計を取るときに有効なのかを具体的に説明していただけるとありがたいのですが…。 よろしくお願いします。

noname#25799
noname#25799
回答No.2

おはようございます。面白そうなので考えてみました。素人なので全然はずしている可能性ありです。(信頼度95%以上!?) まず、確率の計算ですから、帰無仮説を設定するのが普通かと思います。また、問題を簡略化して、たいへん使いやすいを100点、とても使いにくいを0点として、25点刻みにして得点化して、平均点を求めることにしてみました。ここでは、 帰無仮説:「平均点は50点より小さい。」と設定してみました。 製品ですから、これが棄却されて欲しいところです。 こういう場合、権出力検定(Power Analysis)という手法がとれるんではないかと思います。詳しくは例えば参考URLを読んでみてください。(日本語のよさそうなURLが見つけられませんでした。) この中に単純減少グラフがありますが、これが回答に近いんではないかと思っています。(でも、信頼度は90%ですから95%にするとサンプル数の上乗せが必要です。)ここでは、150万人の母体を設定していて、横軸が、実際の比率で母集団での本当の平均点が75点なら0.75、60点なら0.60に相当すると考えいいかと思います。この表を見ていえることは、その製品が素晴らしく75点平均が十分見込めるのなら20人くらいの統計で、これは50点よりいい製品と言えること。逆に55点くらい平均しか見込めないのなら、同じことをいうのに800人以上のサンプリングが必要になるということです。つまり、商品がどれだけ優れているかによりサンプル数が変わってくるようです。 最初の帰無仮説も満足できるものでないかもしれません。気持ち的には例えば75点以上に設定したいですよね。とすると、当然結果は変わってきます。 残念ながら紹介できませんが、検出力検定のできるソフトを見繕って、いろいろ試してみるのがいい気と思います。

参考URL:
http://www.statsoft.com/textbook/stpowan.html#index
回答No.1

まず、ユーザーすべてにアンケートをとった場合、比率が1:1:1:1:1に分かれるとします。しかし、ユーザー500人のうち、100人にアンケートをしたら、極端な話、100:0:0:0:0になる可能性がありますよね。それは、アンケートした100人がたまたま一つの選択支に集中した場合で、他の400人の答えは反映されてないからですよね。でもその確率は1/7.8x10^69で、ほぼ起こりえませんよね、でも99:1:0:0:0なら起こりうる確率はさっきより当然あがります。で、一番可能性として高いのは20:20:20:20:20と1:1:1:1:1にきれいに分かれる場合ですよね?そこで、比率の±5%の誤差に収まっていれば正確な結果といえるなら、例えば19:21:20:19:21などもOKですよね?このOKになる場合が全体の95%を上回っていれば95%以上の信頼度といえるのではないでしょうか。 期待値を求める時など、それぞれの場合の確率を求めますよね?そこでOKの範囲の確率の和が95/100以上になった時、信頼度95%といえるのではないでしょうか。

関連するQ&A