• ベストアンサー

標本分散について

標本分散の分母がnなのかn-1なのかで、よく混乱します。 標本分散を計算する場合は、n-1でわり、 全標本分散を計算する場合は、nでわると理解しているのですが、 こんな問題が出ました。 問、次のデータに関して変動係数を求めよ -3,-4,3,5,-1,7,-2 この問題では、標本分散を計算するときに、 回答では、n-1でわる(分散を計算する際の分母は標本分散だから)と 書いてあります。 しかし、 問、次のデータに関してXとYの標本相関係数を求めよ。 ただし、標本に対する操作にとって必要な自由度調整を行うこと [x,y]=[1,3][0,-1][-2,-3][2,1] この問題の回答では、標本分散を計算する際に、nで割っていました。 変動係数を計算する場合は、n-1でわり、 標本相関係数を計算する場合は、nでわる こう考えてOKなのでしょうか?回答が間違っているのか、 私が勘違いしているのかどうかもわからない状態です。 ご教授お願いします。

質問者が選んだベストアンサー

  • ベストアンサー
noname#50894
noname#50894
回答No.1

標本データx_1,x_2,…,x_nが与えられるとき、 標本平均:x~=Σ[i=1,n]x_i/n 標本分散:S=Σ[i=1,n](x_i-x~)^2/n 不偏分散:V=Σ[i=1,n](x_i-x~)^2/(n-1)={n/(n-1)}S で定義されますね。 >変動係数 標本にもとづく、変動係数の定義は、V/x~ですね。 >回答では、n-1でわる この記載は正しいと思いますが、 >(分散を計算する際の分母は標本分散だから) 上の用語“標本分散”は、厳密には“不偏分散”と表現すべきだと思います。 時々、無神経に用語を区別せず、混乱させる本があることを、私も承知しています。 大雑把に考えると、 変動係数の場合、平均との差の合計 Σ[i=1,n](x_i-x~)^2は、自由度が1下がり、n-1になり 推定値としては、不偏分散:V=Σ[i=1,n](x_i-x~)^2/(n-1)を採用する。 [感覚的な説明ですので、ご承知下さい] 相関係数は >[x,y]=[1,3][0,-1][-2,-3][2,1] の関係から求め、自由度がnのままで下がりませんね。 従って、 >標本相関係数を計算する場合は、nでわる で良いと思います。

bundsvm
質問者

お礼

回答ありがとうございます。返答遅れて申し訳ありませんでした。 わかりやすい解説ありがとうございます。

その他の回答 (2)

  • backs
  • ベストアンサー率50% (410/818)
回答No.3

この質問はこの掲示板でもよくあがりますが、どの参考書にも適切な解説は載っていないものでしょうかね。。。 質問する人の本にたまたま載っていないだけなのかもしれませんが。 要するにですね、サンプルサイズが大きい場合はnで割っても問題ないのですよ。ただし、サンプルサイズが小さい場合はn-1で割らないとその値がかなり小さめになってしまうんですよ。だから、サンプルサイズが小さい場合の標本分散(標準偏差)はn-1で割るようにといわれているわけです。 サンプルサイズが何百もある場合はnで割っても構いませんが、基本的にはどのような場合であってもn-1で割ることがほとんどですね(つまり不偏推定量を用いるということ)。 以上の理由から明らかですが、 > 変動係数を計算する場合は、n-1でわり、標本相関係数を計算する場合は、nでわる というのはよろしくありません。

bundsvm
質問者

お礼

過去ログで検索し、 もっと多くの本で調べてから質問するべきでした。 申し訳ございません。わかりやすい回答ありがとうございます。

noname#50894
noname#50894
回答No.2

No.1の一部を訂正します。 >変動係数 >標本にもとづく、変動係数の定義は、V/x~ですね。 不偏分散の平方根v=√Vを定義して、 #変動係数の定義は、v/x~ …のようです。失礼しました。 更に、 >[感覚的な説明ですので、ご承知下さい] の箇所も、理論的根拠にもとづく説明でないことをご承知下さい。

関連するQ&A