• 締切済み

統計基礎に関して

統計基礎に関して下記をご教授ください。 インターネット30分/日を超えているかどうか調べるために無作為調査を行った。 調査の結果50人の無作為標本データから標本平均値32と標本分散49が得られた。 この際の不偏分散の求め方と採択域の上限値の求め方がわかりません。 また、帰無仮説は棄却されるのでしょうか・・・ ご教授いただけると幸いです。 よろしくお願いいたします。

みんなの回答

  • stomachman
  • ベストアンサー率57% (1014/1775)
回答No.1

 標本分散(s^2)を計算する時にはサンプル数Nで割り算しますが,「不偏分散(σ^2)」すなわち母集団の分散の不偏推定値を計算する時にはNではなくN-1で割り算します.  標本分散の計算は各データから平均値を引き算したものの2乗の総和を取りますね.そのときに使う平均値はおなじデータ群から算出した標本平均mであり,母平均の不偏推定値μはmと同じですけれども、母平均(母集団の真の平均値。これは未知です)そのものからは幾らかずれている.そのずれの効果を打ち消す働きをするのがN-1というやつです.  検定については,データの分布がどうであるかが問題になります.正確に言えば「データが従うものと仮定する理論分布として,どんなものを採用するか」ということです.たとえば,住民基本台帳からランダムに取り出した人に「インターネットを一日何分使うか」を聞き取ったというデータなら,下限0,上限1440があって,またヘビーユーザやら結構な割合の「インターネットなんか知らん」人もいるわけで,正規分布とはまるきり似ていないだろうと思われます.その分布がどうなってるのか調べないことには手も足も出ない,ということですね。  しかし,ご質問にある数値に限った話をすると,これはやたらに分散が小さい.標準偏差σが7[分/日]ぐらいしかありません.データがものすごく狭い範囲に集中しているわけです.ということは、おそらく特殊な条件を満たす母集団(そこにはヘビーユーザや「インターネットなんか知らん」人を含まない)が設定された調査の話なのでしょう.そしてまた,平均値が調査したい「30分/日」に大変に近い.つまり,理論分布としてどんなものを使うにせよ,その裾野の方がどうなっているかはあまり重要でない訳です.そういう事情であるなら,この場合に限っては正規分布でもソレナリの近似になっていると期待しても良さそうに思われます.  と,これだけの考察を踏まえた上で,  「母集団のデータは,平均が標本平均m,分散σ^2が上記の不偏分散の値である正規分布に従う」 という帰無仮説を,適当な有意水準を設定して検定すりゃいいかな,という話にたどり着くんです.  そこでこの帰無仮説を,同じ意味ですが言い換えて、  「母集団からとったサンプル(N=50)の平均値は,平均がm,分散が(上記の不偏分散の値)/Nである正規分布に従う」 とすれば,あとはもう教科書に書いてあるイチバン基本の手続き通りです.

関連するQ&A