• 締切済み

出現頻度と出力値が比例する場合の平均値

初めて質問します。企業の企画部門勤務です。 今度サンプル調査を行うのですが、出現頻度と出力値が比例するような以下の例のような調査の場合、平均値はどのように求めればよいのでしょうか。(以下の例は、Webでなんとか解を見つけようとして、やっとたどり着いたサイトに掲示されていた内容ですが、答えは自分で考えろ!になっていました。) (例) 1年間に何回ゴルフをやるかを知りたい。そこでゴルフ場で利用者を無作為抽出して「あなたはこの1年間に何回ゴルフをしましたか」と質問する。そして「平均回数×ゴルフ人口」の式で延べ回数を計算する。これで正しい結果が得られるだろうか。答はノー! 理由はゴルフ回数の多い人ほどサンプルに選ばれやすいので、推定値は過大に出てしまうからである。正しい推定式については皆さんへの宿題としたい。 Q1)サンプルデータからの平均値はどのようにもとめればよいのでしょうか。 Q2)調査期間が(費用の都合などで)十分に取れない場合、2ヶ月に一回とか半年に一回のひとのデータが取れない場合が生じますが、それはどのように考えればよいのでしょうか。(全くやらない人は考慮しない。) 当方、標準偏差まで位なら何とか理解できる初心者です。が、上司に考え方も含め説明する必要がありますので、数式で個人的にはありがたいのですが、統計素人の方にも直感的に分かるような説明だとさらに助かります。 皆様のお智恵を拝借いたしたくよろしくお願いします。

みんなの回答

  • backs
  • ベストアンサー率50% (410/818)
回答No.1

企画部に勤務されているプロに回答するのもおこがましいのですが,あくまでも参考として受け取って頂ければよろしいかと思います。 >「平均回数×ゴルフ人口」の式で延べ回数を計算する。 ゴルフのプレイ回数が名義尺度なので扱える代表値は平均値ではなく中央値ですね。だからこれはサンプルサイズとか以前の問題ですね。 したがって,Q1についても出現頻度ということであれば平均値は出せません。計算はできますがその値に意味はないということになります。 Q2:経費の都合でデータが取れない場合はどうすれば良いですか?という質問もよくあるのですが,データがとれないのであれば得られたデータをうまく利用するしかありません。あらかじめそのような事態が予測できているのであれば,それに適した分析方法というのがいずれかはあるわけですから。 どうも直接の回答になっていませんが,参考にしたURLを載せていただくとその作者が何を言おうとしていたのかが分かるかもしれませんが、、、

tnk99
質問者

補足

ご回答ありがとうございました。お返事遅くなり申し訳ございません。 当初質問が掲示されていたURLは以下の通りです。 http://www.intage.co.jp/word60/29.html 例えば会員数2人!のゴルフ場があったとして、会員Aは月一プレーヤー、会員Bは半年1回プレーヤーとして、会員Bがプレーした月を含む3ヶ月間聞き取り調査したとすると、会員の区別がつかない場合、「毎月します。」という回答が3件(実は会員Aの回答が3回)、「半年に1回です。」という回答が1件(会員B)となり、単純に平均すれば (1)(12×3+2×1)/(3+1)=9.5回/人 となりますが、実際は (2)(12+2)/2=7回/人 となります。4件のサンプル情報(1)から真値(2)を導きたいというのがQ1です。こうやって書いてみるとひょっとしたら算数の問題かもと思ってきました。 Q2は上述の例の場合、たまたま会員Bのプレイしている期間に調査を実施できましたが、時期によっては会員Aの回答のみしか集まらない場合も想定できます。その場合、どのような前提条件をおけばよいのでしょうか。母集団の分布が直感的に正規分布(またはその片側)とは考えられず、数回のところにピークがあり、0回は0、ピークより多い側ははだらだらと漸減している分布になると思うのですが、どのような分布をしていると前提するのが適当でしょうか。 ながながと書きましたが、よろしければアドバイスよろしくお願いします。

すると、全ての回答が全文表示されます。

関連するQ&A