• ベストアンサー

大数の法則についての質問です

過去の質問にもありましたが、きちんとした回答がなかったので、改めて質問します。 大数の法則の中で、母集団の平均をμ、分散をσ2とすると、標本n個(x1,x2,・・・xn)の平均の期待値がμ、平均の分散がσ2/nになる理由がよく分かりません。 特にE(x1)がμになるというところが、x1は独立で母集団の性質に従うという説明しかないので、理解しかねます(E(x1)はx1の平均だからx1ではと思っています)。 ご存知の方は是非教えてください。お願いします。

質問者が選んだベストアンサー

  • ベストアンサー
  • adinat
  • ベストアンサー率64% (269/414)
回答No.2

> 母集団から得られた標本が確率変数の場合(私はサイコロの目の場合と理解してます)、平均値の期待値がμに近づくというのはなんとなく理解できます。しかし、今は測定値の場合に証明できるかどうか考えています。 再度申しますが、平均値の期待値はμに近づくのではありません。平均値の期待値はμそのものです。具体例をひとつだけあげます。公正なコインを投げる試行を考えてください。n回目に出たコインが表の場合X_n=1、裏が出た場合X_n=0となるような確率変数の列{X_n}を考えます。明らかに確率変数{X_n}はすべて互いに独立であって、X_nの期待値は1/2です。E(X_1)=E(X_2)=…=E(X_n)=1/2というわけです。これはご理解いただけますよね。そこで実際に実験をしたとします。コインをn回投げました。その結果、表、表、裏、表、裏と順に出たとしましょう。そうすると、X_1=1、X_2=1、X_3=0、X_4=1、X_5=0というわけです。この場合5標本の平均値は2/5であるわけです。これは以上でも以下でもありません。確定した値なのです。その代わりにY=(X_1+X_2+X_3+X_4+X_5)/5という新しい確率変数を考えたとしましょう。これはいわゆる標本(変量)平均と呼ばれる確率変数です。実験しないと分からないランダムなものであるわけです。このYの予想される期待的数値がE(Y)=E((X_1+X_2+X_3+X_4+X_5)/5)=(E(X_1)+E(X_2)+E(X_3)+E(X_4)+E(X_5))/5=(1/2+1/2+1/2+1/2+1/2)/5=1/2になります。つまり標本平均というのは、期待値が各標本の期待値そのものに一致するわけです。これって当然の性質ですよね。 > そこで、n個の測定値(x1,x2・・・xn)がmセットとれたときを考えてみたところ、mが∞まで大きくなったとすると、n個の測定値をXnとして期待値を求めるとE(Xn)=μに(無理やり)なりました。分散に関してもσ^2/nになりましたが、これも正しいかどうか疑わしいです。 Xnが何のことか理解できないので、おっしゃる意味を理解しかねますが、上記で述べたことをもう少し吟味して欲しく思います。これは大数の法則の根幹にかかわることだと思います。以下、少しだけそのことに触れておきます。 再びコイン投げの例を出します。(サイコロでも同じです。)コインを投げて表が出たら1、裏が出たら0である確率変数を考えます。当然期待値は1/2なわけですが、たかだか1回投げた程度では0か1かが半々の確率で得られるだけです。決して1/2という値が実現されるわけではありません。そこでコイン投げをたくさん行って、それらから得られる確率変数X_nの"平均"を考えることにします。それがいわゆる標本(変量)平均と呼ばれるものです。ここではY_n=(X_1+X_2+…+X_n)/nと書くことにします。Y_nは確率変数です。実際に実験しないとどういう値をとるかはわかりませんし、実験のたびにかわる数値です。そこで"だいたいどれぐらいの値をとるか"を考えるためにY_nの期待値を計算したとします。それがE(Y_n)です。さんざん申したとおり、E(Y_n)=1/2です。標本(変量)平均の期待値はひとつの標本の期待値と一緒なのです。これは当たり前のことです(少なくとも直感的には納得がいくと思います)。ところが実際に実験してみても、標本平均が1/2になることはあまりありません。たとえば5回コイン投げをしたとき、先ほどの例のように、1,1,0,1,0などとなれば、この場合の平均は3/5であって1/2ではありません。あるいは別の実験をすれば、0,0,0,0,0となって平均が0になることもあります。でもとにもかくにもだいたい1/2ぐらいが期待できるのだ、というのが期待値1/2という主張です。大数の法則というのは、ここでnを大きく取った場合、"ほとんど確実に"その標本平均は1/2に近いのだ、ということを主張しています。具体的にコイン投げを1万回やったとして、表が出るのがだいたい5000回と期待できる(期待値1/2)ですが、実験結果はまちまちで、その1万回の平均は0から1の間でばらつくでしょう。ですが、nが大きいと0や1に近くなることはまずなく(といってもものすごい小さい確率ですが0ではない)、ほぼ1/2に近い数字が得られるというのです。 今回のコメントではあえて意識して"平均"と"期待値"という言葉を使い分けて書きました。期待値のことを平均と呼ぶこともありますが、平均のことをいつでも期待値と呼んで正しいのではありません。たとえばコイン投げ5回を行ったときの期待値というのと、平均というのではニュアンスも違うし、実際まったく違う意味の場合もあるのです。5個のサンプルの単純平均を取るという操作は期待値とはなんら関係がないことです。E(X_1)と書いたときはX_1の期待値という意味なのです。E((X_1+X_2)/2)は(X_1+X_2)/2の期待値という意味なのです。 それからweb上で数式を記述される場合、右下につける添え字は"_"を使うのが普通です。さらに累乗記号は"^"で表すのが流儀です。上なのか下なのか、単に掛け算なのか紛らわしい場合があるので、この記法を使われることをお奨めします。 ※それからもう書き込みませんので悪しからず。

kak31
質問者

お礼

二度目の回答ありがとうございました。大変自分勝手な質問をしたのにもかかわらず、丁寧にご回答いただいてすいません。私の中で平均値と期待値を混同して考えていました。お陰でなんとなくですが理解できました。あとは自分の中で理解を深めてみます。adinatさん、本当にありがとうございました。

その他の回答 (1)

  • adinat
  • ベストアンサー率64% (269/414)
回答No.1

独立性関係なく、期待値には線形性が成り立ちます。各標本x_iは平均μ、分散σ^2に従うのですから、 E[(x_1+x_2+…+x_n)/n]=(E[x_1]+E[x_2]+…+E[x_n])/n  =(μ+μ+…+μ)/n=μ となります。分散に関しては独立性がある場合に和の線形性が成り立ちます。スカラー倍は2乗で出ます。すなわち、 V[(x_1+x_2+…+x_n)/n]=(V(x_1)+V(x_2)+…+V(x_n))/n^2  =(σ^2+σ^2+…+σ^2)/n^2=σ^2/n というわけです。 なお分散に関しては、X,Yが独立であるとき、 V(X+Y)=V(X)+V(Y) が成立します。一般には成り立ちません。独立でない場合は余分にXとYの共分散が絡みます。したがって独立性がなくても無相関であればこれは正しいです。 V(αX)=α^2V(X) は常に正しく、これは単に分散の定義から従います。この二つの性質は非常に重要なので覚えておかれることをすすめます。 最後にひとこと。標本という用語は非常に紛らわしいので注意が必要です。具体的なサンプルという意味にとれる場合(正確には標本値と呼ぶべき)と、単にある分布に従う確率変数を指す場合(正確には標本変数あるいは標本変量と呼ぶべき)の両方を意味するからです。この場合のx_1は文脈から標本変数の方だと類推できますが(違っていたらごめんなさい)、その場合E(x_1)=x_1とはなりません。x_1というものはランダムな値をとる確率変数であって、その期待される平均値がμであるという意味なのです。もしx_1がある具体的に観測された数値であるという意味であるならば、おっしゃることは正しいですが、あまりx_1の平均とか言ったりすることはないでしょう。ひとことと言って長くなってきましたが、普通は標本値の場合は小文字でx_iのように、標本変数の場合はX_iと大文字で表すのが慣わしです。ですが、守られないこともままあるので、文脈で類推してください。標本値と標本変数の違いをしっかり理解されることは確率統計を学ぶのに大変重要なことですので、じっくり考えてみられるとよいと思います。

kak31
質問者

補足

adinatさん、回答ありがとうございます。 母集団から得られた標本が確率変数の場合(私はサイコロの目の場合と理解してます)、平均値の期待値がμに近づくというのはなんとなく理解できます。しかし、今は測定値の場合に証明できるかどうか考えています。 そこで、n個の測定値(x1,x2・・・xn)がmセットとれたときを考えてみたところ、mが∞まで大きくなったとすると、n個の測定値をXnとして期待値を求めるとE(Xn)=μに(無理やり)なりました。分散に関してもσ^2/nになりましたが、これも正しいかどうか疑わしいです。 mセット取るという考え方について宜しければアドバイスをお願いします。

関連するQ&A