• 締切済み

統計学 標本と母集団

統計学に関して質問なのですが、、、 標本の分散を求めるときはn-1で割り、母集団の分散を求めるときはnで割ると思うのですが http://ja.wikipedia.org/wiki/%E6%A8%99%E6%9C%AC_(%E7%B5%B1%E8%A8%88%E5%AD%A6) このwikiにある標本の分散が母集団と同じものになるというのが、よく分かりません。 どういうことなのでしょうか?誰か教えて下さい。お願いします。

みんなの回答

  • takurinta
  • ベストアンサー率71% (64/90)
回答No.4

No. 3です。 > 標本の真の分散が母分散と一致すると仮定しているからですか? その通りと言えなくもないのですが、母集団として標本の真の平均、真の分散を特徴として有する分布を想定するというのが実際の流れなので、一致するのはむしろ前提ということになるのではと思います。 > 例えば、標本のデータと母集団の分散が与えられていた場合は、標本の分散としてデータから計算した分散と母分散のどちらを答えるのが適切ですか? よくわかりません。普通は母分散は既知ではなく、データから推定するものであり、手元には標本の分散しかありません。母分散が既知ならば、分散を推定する必要はありませんが、取ってきたデータそのものの平均や標準偏差などを記述することにもそれなりの意味があると思います。 わざわざデータを取るということは真の平均や真の分散が知りたいのではないかと思われます。すなわち、既知としている平均や分散と、取得したデータの真の平均等は異なっていると疑っているのではないかと思われるので、それならばやはりデータから平均などを計算することに意義があるのではないかと思います。

ken0829ken
質問者

お礼

返信ありがとうございます。 自分の中で幾分か理解が進みました! 統計学って興味深いけどややこしい学問のような気がします。。。 ありがとうございました!!

  • takurinta
  • ベストアンサー率71% (64/90)
回答No.3

No.2です。 「X1, X2, X3,.....Xnが正規分布からの無作為標本の場合の標本分散Var(X1), Var(X2),,,, Var(Xn)は?」 についてですが、Varという記号は普通は標本分散のことを指しません。「標本Xiの分散」とかではありませんでしたか? もしも「標本分散」という用語を使っていたなら、不注意な先生かもしれません。 普通に使われる用語としての分散はVar(X)= E[{X-E(X)}^2] で定義されるものであり、標本分散s^2は標本平均m=ΣXi / n としたときに s^2 = Σ(Xi-m)^2 / n として定義されるものです。 もしも母集団の正規分布の分散がσ2として与えられていたならば標本についても分散はσ2となります。 「標本分散をデータから計算できないため」というのは適切な理由ではありませんが、「標本X1, X2,.., Xnの分散はいずれもσ2である」と答えるのは適切だと思います。母分散が明示的に与えられていないなら、「母分散をσ2とすると標本の分散はいずれもσ2となる」としても良いかと思います。

ken0829ken
質問者

お礼

早速の回答ありがとうございます。 「標本の分散」と「標本分散」の区別がついていなっかたため、紛らわしい質問となっていました。申し訳ないです。 もう少しだけ質問につきあってもらえないですか? 標本の分散がσ2となるのは、takurintaさんが回答してくださったように、標本の真の分散が母分散と一致すると仮定しているからですか?例えば、標本のデータと母集団の分散が与えられていた場合は、標本の分散としてデータから計算した分散と母分散のどちらを答えるのが適切ですか?(質問が現実的でないような気もしますが。。。) お時間あればご教授お願いします。

  • takurinta
  • ベストアンサー率71% (64/90)
回答No.2

No. 1です。見落としていましたが、リンク先の 「標本 x1, x2, ... は i を任意の番号として平均 E[xi] = m, 分散 V[xi] = σ2 を満たす。」 のことでしたか。 これは、標本分散としてデータから計算されるもののことではなくて、真の分散のことを指しています。 どの標本も同一の母集団から得られるものなので、真の平均 (母平均) と真の分散 (母分散) は共通である、というセッティングの説明にすぎません。

ken0829ken
質問者

お礼

回答ありがとうございます! takurintaさんの回答を受けてさらに質問なのですが 「X1, X2, X3,.....Xnが正規分布からの無作為標本の場合の標本分散Var(X1), Var(X2),,,,Var(Xn)は?」とあり、この問題にはデータがなかったのですが、この場合は標本分散をデータから計算できないため、σ2と答えるのが適切ですか? (問題の一部を切り取っていますので分かりにくいかもしれません。。。)

  • takurinta
  • ベストアンサー率71% (64/90)
回答No.1

リンク先に「標本の分散が母集団と同じものになる」という文言は見当たりませんでした。 もしかしたら、最後に書いてある 「標本平均 Xバーの従う標本分布について、平均 E[Xバー] = m, 分散 V[Xバー] = σ2/n を得る。」 のことを指しているのでしょうか。 だとしたらそれは、平均についての議論で、標本分散の話ではないです。nを大きくするほど平均値のばらつきは小さくなる、という話です。

関連するQ&A