- ベストアンサー
統計(自由度n-1)について
統計の自由度のn-1で割るところがよくわかりません。証明とかいう意味ではなくて、0-1分布の場合についてです。例えばあるテレビの視聴率を調べるときに、標本数nを300とし、そのうちm人がある番組を見たとします。ここで視聴率pをp=m/nと定めます。このとき不偏標本分散はp(1-p)だとある本に書いてありましたが、n-1で割るのならnp(1-p)/n-1 になると思うんですがどうでしょうか?それともn/n-1=1 で近似したのでしょうか?少し分かりにくい文章ですいませんがどなたか教えてください。
- みんなの回答 (1)
- 専門家の回答
質問者が選んだベストアンサー
僕も自由度という考え方が好きではありません。確かに直感的な説明をするときは便利なのですけれど、数学的に厳密な話ではなさそうですからね。 ところで、おそらくその書物の記述は間違っていて、arabujinn様な数が不偏分散となると思います。以下Xをベルヌーイ分布(0-1分布)で確率はpであるとしましょう。すなわち確率pで1を、確率1-pで0を取る確率変数であるとします。このベルヌーイ分布Bi(1,p)に従う母集団から大きさnのランダム標本X_1,…,X_nを考えます。紛らわしいので(標本)視聴率に相当する確率変数をY=(X_1+…+X_n)/nで定義します。n=300、mをX_1~X_nのうち1であるものの個数とすればarabujinn様のおっしゃる視聴率を表していると思えます。さてY(1-Y)なる確率変数を考えます。このときE[Y(1-Y)]=p(1-p)がもし成り立っていればY(1-Y)は母分散p(1-p)の不偏推定量ということになり、不偏標本分散と呼ぶにふさわしいものと考えられます。では以下計算を。 Y(1-Y)=Y-Y^2=(X_1+…+X_n)/n-(X_1+…+X_n)^2/n^2=(X_1+…+X_n)/n-(X_1^2+…+X_n^2)/n^2-2(X_1X_2+X_1X_3+…+X_{n-1}X_n)/n^2 となります。幾分面倒なので紙に書かれて落ち着いて計算してみてください。一番最後の項のカッコの中身は全部でnC2個だけあります(n個の中から2つ選ぶ組み合わせ)。さてX_iとX_jはiとjが互いに等しくなければ独立であって、すべて平均pのベルヌーイ分布に従うのでした。そこで期待値の線形性と独立な確率変数の積は期待値の積になること、さらにE[X_i]=E[X_i^2]=pに注意して上の期待値をとれば、 E[Y(1-Y)]=E[(X_1+…+X_n)/n]-E[(X_1^2+…+X_n^2)/n^2]-2E[(X_1X_2+X_1X_3+…+X_{n-1}X_n)/n^2] =np/n-np/n^2-2{n(n-1)/2*p*p}/n^2 =p-p/n-(n-1)p^2/n =(n-1)/n*p(1-p) となります。したがってY(1-Y)はp(1-p)の不偏推定量ではありません。実は上の計算からn/(n-1)*Y(1-Y)ととればp(1-p)の不偏推定量になることが分かりますね。
お礼
ありがとうございました。自信はあまりなかったのですが、ようやくわかりました。ですが大抵の本はnで割っているので、近似しているだけなんだと思います。