- ベストアンサー
不偏分散での「すべての可能な標本」とは?
- 不偏分散の概念について説明します。
- 不偏分散の計算には、母集団の大きさと標本の大きさが関係します。
- 標本の採り方によって、不偏分散の考え方が異なる場合もあります。
- みんなの回答 (6)
- 専門家の回答
質問者が選んだベストアンサー
重複を許さない無作為抽出の場合、いわゆる「不偏分散」の期待値(平均)は、母分散より大きくなります。 誤解がないように、きちんと記述してみます。 母集団サイズをNとして、{x1, x2, ... , xN}を各客体の値とします。このとき、次のμを「母平均」、σ^2を「母分散」といいます。 μ= (1/N)Σ[i=1 to N]xi σ^2= (1/N)Σ[i=1 to N](xi-μ)^2 次に、サンプルサイズをnとして、{X1, X2, ... ,Xn}をサンプル内の各客体の値とします。各Xiは、x1, x2, ... , xNのどれかです。サンプルによってXiの値が変わるので、Xiは、確率変数です。このとき、次のmを「標本平均」、s^2を「不偏分散」ということにします。 m = (1/n)Σ[i=1 to n]Xi s^2 = (1/(n-1))Σ[i=1 to n](Xi-m)^2 以下、重複を許す場合と、重複を許さない場合で、各種の指標を比較します。期待値をE、分散をV、共分散をCovで表します。また、「無作為抽出」とは、「すべてのサンプルが等確率」で抽出されるような抽出を指します。 (重複を許す無作為抽出) A1 サンプルの個数= N^n A2 1つのサンプルが選ばれる確率= 1/N^n A3 E(Xi) =μ A4 V(Xi) =σ^2 A5 i≠jのとき、Cov(Xi, Xj) = 0 実際は、X1, X2, ... ,Xnが独立である。 A6 E(m) =μ A7 V(m) = (1/n)σ^2 A8 E(s^2) =σ^2 (重複を許さない無作為抽出) B1 サンプルの個数= N!/(N-n)! B2 1つのサンプルが選ばれる確率= (N-n)!/N! B3 E(Xi) =μ B4 V(Xi) =σ^2 B5 i≠jのとき、Cov(Xi, Xj) = -1/(N-1) X1, X2, ... ,Xnは独立でない。 B6 E(m) =μ B7 V(m) = (1/n)((N-n)/(N-1))σ^2 B8 E(s^2) = (N/(N-1))σ^2 ご質問の「すべての可能な標本の不偏分散の平均は、母分散に一致する」とは、A8のことを意味します。重複を許さない場合、対応する式は、B8です。 なお、B5に注目してください。重複を許さない無作為抽出の場合、各客体の値は独立でありません。このことが、いろいろな場面で、重複を許さない場合の取り扱いを面倒にしているのです。
その他の回答 (5)
- Ishiwara
- ベストアンサー率24% (462/1914)
「標本」の意味に2とおりある、ということが重要です。 1枚のコインを投げたときのオモテの数: 実験的な標本では、試行回数は任意で、実験結果は0と1がいろいろに混ざったものですよね。 理論的な標本では、試行回数は2と考え、結果は「0」と「1」がそれぞれ1つと考えます。これで無限回試行の結果が十分に表現できます。ここでは「重複」はありません。 ご質問の「標本」とは、理論標本であって、実験標本ではありません。 理論標本では、互いに独立であって、生起確率が等しく、かつ確率の合計が1となるようなものが得られることが重要です。場合の重複は、あまり気にする必要はありません。例えば、2枚の1円玉を投げる場合、重複が起きますが、一方のコインに印を付けることによって重複の問題は回避できます。ご質問の場合は、すべての「球やコイン」に印を付けるべきでしょう。 また、理論標本では「元に戻す」とか「戻さない」という問題はふつう考えません。どうしても考えたければ「戻す」としましょう。戻さないで不変分散を考えることも当然できますが、実用的な意味がどれだけあるか疑問です。例えば、1番目の人がクジを引く前に2番目の人の当選確率とその分散を考えるのは無意味です。 実験標本のパラメータは、常に理論との間に相違(*)を生じますが、理論標本のパラメータは唯一の解です。 (*) この相違が統計学の主たるテーマなのですが。 理論標本とか実験標本という言葉は、本当は無いのですが、ご質問の流れを尊重して使ってみました。もともと標本とは試行で得られるものです(擬似試行や空想試行を含みます)。
お礼
回答ありがとうございます。 勉強不足の私には理解できないとこがありました。 すみません。 そもそも、重複を許さないと考えた時点で、それは不偏分散の定義から外れてしまうと考えるべきなのかな・・・
- ramayana
- ベストアンサー率75% (215/285)
ANo.1=ANo.4です。まったく、錯乱していました。ANo.4の訂正の部分は、無視してください。間違いです。
お礼
ANo.1のほうが正しいんですね。 私も誤解してました。 どうも ありがとうございます。
- ramayana
- ベストアンサー率75% (215/285)
ANo.1です。訂正させてください。B1とB2のN!/(N-n)!と(N-n)!/N!は、それぞれN!と1/N!に訂正します。サンプルを、組み合わせでなく順列とみなすということ、すなわち、同じ組み合わせでも、サンプル内の客体の順番を区別するということです。今回の平均や分散のように客体の順番に関係ない計算をするだけなら、どちらでも同じことですが、一般的には、順番に依存するような計算も視野に入れておいた方がよいからです。 ANo.2さんの「期待値が母分散に一致しなければ不偏分散とは言えない」というのは、もっともです。その意味で、重複を許さない場合の不偏分散を、次のように定義するほうが自然かもしれません。 s^2 = ((N-1)/(n-1)N)Σ[i=1 to n](Xi-m)^2
お礼
訂正内容を確認しました。 ご丁寧にありがとうございます。
ANo.2です。 ぼけたことを書いてしまいました。 有限母集団でも復元抽出すれば解説のとおりになりますね。 失礼しました。
お礼
訂正を確認しました。 有限母集団・無限母集団等、知らない用語を教えていただくと それだけでも勉強の助けになります。 確率・統計は奥が深そうですね。 ありがとうございます。
> 例えば > 母集団の大きさが、5 > 標本の大きさが、2 > のときの、すべての可能な標本には、5*5=25通りとあります。 この例は、その解説書にあったものでしょうか? そうだとすると、その解説書の説明が少しおかしいのです。 母集団の大きさが5ならば有限母集団となるため、可能な標本の数は5つから2つを選ぶ組み合わせの10通りで、25通りにはなりません。(重複なし) 採り得る値が5通りで無限母集団であるならば25通りとなります。(重複あり) > 「すべての可能な標本の不偏分散の平均は、母分散に一致する」 そもそも、期待値が母分散に一致しなければ不偏分散とは言えないのではないでしょうか?
お礼
ありがとうございます。 重複する場合、しない場合を並べて 説明していただき、とても分かりやすかったです。 大変助かりました。