- ベストアンサー
標本分散と不偏分散の使い分けについて。
標本分散と不偏分散の使い分けについて。 私はメーカーに勤めており、電子部品のばらつきなどでよく標準偏差σを目にします。 自分で少し調べてみると標準偏差にも標本分散を使うときと不偏分散を使うときがあることを知ったのですが、説明が難しくどのように使い分けていいのか分かりません。 標本分散と不偏分散はどのように使い分ければいいのでしょうか。 例えば電子部品の性能や実験データのばらつきにはどちらが使われているのでしょうか? ご存知の方、教えてください。 よろしくお願いします。
- みんなの回答 (3)
- 専門家の回答
質問者が選んだベストアンサー
母集団から全ての標本を抽出して得た、すなわち、全てのデータを使った分散を標本分散、というようです。しかし、標本分散の文字から、抽出した標本の分散という意味から、不偏分散の意味でも使う(私もそうでした)こともあり、標本分散がどちらなのか、混乱しています。質問者も標本分散をこの意味で使っていると想います。 母集団のデータを知るのが統計学では目的ですが、それには全数(全サンプル)を利用する必要があります。しかし、製品検査などでは、全数検査だと商品が残らない、あるいは手間がかかり過ぎるので抜き取りを行い、全数検査の替わりにできます。この場合の分散は、不偏分散で代用ができます、というのが推測統計学です。 すなわち、全数検査(文字通り全数、一つ欠けてもダメ)なら標本分散(この用語は混乱を招くので、私は使いませんが)、抜き取りなら不偏分散を利用しています。
その他の回答 (2)
電子部品の性能や実験データのばらつきの調査は標本調査なので標本分散を用います。一方, ある学級の身長のばらつきの調査などは全数調査なので不偏分散すなわち母分散を用います。
お礼
参考になりました。 有難うございました。
- Tacosan
- ベストアンサー率23% (3656/15482)
「不偏分散」というのは「母集団の分散 (母分散) の不偏推定値」です. 母分散が知りたいときに, 「母集団の平均 (母平均)」が分かっているのであれば (それを普通の意味の平均だと思って) 標本から分散を計算すれば OK です. しかし, 通常は母平均も分からないので「標本の平均」を使うことしかできません. すると, 得られる「標本分散」は母分散よりも常に小さくなる方に偏ります. この偏りをなくしたのが「不偏分散」というものです. だから, 標本から「母分散」が知りたければ不偏分散を, 「標本の分散」を求めたいなら標本分散を使うことになります. たとえば, 部品の性能を調べるときに抜き取り検査をしているなら, 「抜き取った部品」が標本になり, 知りたいのは「作った製品の性能の分散」つまり「母分散」なので不偏分散を使うのが正しい.
お礼
詳しい回答有難うございました! 勉強になりました。
お礼
推測統計学というものがあるんですね。 説明もとても分かりやすいです。 回答有難うございました!