- 締切済み
超幾何確立変数の期待値と分散の求め方は?
超幾何確立変数の期待値と分散の求め方は?
- みんなの回答 (1)
- 専門家の回答
みんなの回答
- adinat
- ベストアンサー率64% (269/414)
変換ソフトが悪いせいもありますけど、確率の質問するのなら、確「率」変数が正しいですからね。この間違いが減らないこと(間違って書いても気づかない人が多いこと)には苦々しく思います。 超幾何分布の復習ですが、赤玉M個、白玉N-M個の入った袋から、非復元抽出でk個の玉を取り出したときの赤玉の個数の分布が超幾何分布です。 従って、1つ目に取り出した玉が赤玉である確率はM/Nであるので、k回取り出すことを考えれば、赤玉の期待値が(kM)/Nであることは直感的には明らかでしょう。 きちんと代数的に証明するには二項係数に関するちょっとした演算が必要になりますから、それを少し説明します。二項係数はC(a,b)のように表すことにします。まず、期待値は、 E=Σ x・C(M,x)・C(N-M,k-x)/C(N,k) です。Σはxについて、0からkまで取ります。x・C(M,x)=M・C(M-1,x-1)であることと、ΣC(a,x)C(b,k-x)=C(a+b,k)なる公式を用いて右辺を変形すれば、 E=M・C(N-1,k-1)/C(N,k) が得られるので、これから期待値が分かります。式変形はちょっとした演習問題なので、ぜひご自身で確かめてください。再フォローはしませんので悪しからず。ちなみにここで用いた公式 (1) x・C(M,x)=M・C(M-1,x-1) (2) ΣC(a,x)C(b,k-x)=C(a+b,k) についてですが、有名な公式なので意味を説明しておきます。いずれも階上記号で表して代数的に証明できますが、(1)はM人のクラスからx人の委員を選び、うち一人を委員長とする選び方の総数を意味していると考えます。左辺はまずM人のクラスからx人の委員を選び、そのx人の中から委員長を選ぶという数え方、右辺はまずクラス全員の中から委員長を選び出し、残りM-1人から平委員を選ぶという数え方です。結果が一致するのは当然でしょう。(2)はa人の生徒のいるAクラスと、b人の生徒のいうBクラスがあって、この両方のクラスからk人の委員を選ぶということを考えます。左辺はAクラスからx人、Bクラスからk-x人を選ぶ場合をxについて0からkまでシグマすればよいと言っているわけで、これも両辺が一致するのは当然でしょう。 分散に関しては、まず階乗モーメントと呼ばれる次の量を計算すると分かりよいです。 E[X(X-1)]=Σ x(x-1)・C(M,x)・C(N-M,k-x)/C(N,k) これにはさらに (3) x(x-1)・C(M,x)=M(M-1)・C(M-2,x-2) なる公式を用いれば、期待値の場合とほぼ同様の結果を得ます。この公式も代数的にも容易に示せますが、やはり意味を考えてみれば明らかといえます。 あとはV[X]=E[X^2]-E[X]^2=E[X(X-1)]+E[X]-E[X]^2を用いて分散を得ます。式変形はやはり易しいのでご自身で確かめてみてください。結果は、 V=kM(N-M)(N-k)/{N^2(N-1)} になります。覚え方にはコツがあって、V=k×(M/N)×(N-M)/N×(N-k)/(N-1)と4つの要素の積だとみなします。第2項は1回玉を取り出したとき赤玉の確率、第3項は白玉の確率です。そしてk回取り出すのだからkを掛ける。つまり、最終項以外は、二項分布の分散とまったく同じnpqという形をしています。そして最後の項がいわゆる有限母集団修正項と呼ばれるもので、玉の合計数がN個で有限で、しかも非復元抽出するために、玉を取り出せば出すほど赤玉の合計数のばらつきが小さくなることを反映した補正項です。もし玉を1つしか取り出さないのであれば、k=1ですが、それは単なるベルヌーイ試行(二項分布と同じ)だから、補正項は1になるべきで、もし玉をN個全部取り出せば、赤球は100%確実にM個出て、まったくばらつかないので補正項は0になるわけです。したがって、補正項が(N-k)/(N-1)の形をすることも納得できるでしょう。 二項係数の計算はスマートにやりましたが、慣れていないと少し難しいかも知れません。非常に愚直な計算をしているが丁寧な文献を見つけましたので、参考URLに載せておきます。参考にしてみてください。たぶん大変そうに見えると思いますが、本質的には私が上に指摘した(1),(2),(3)の3つの公式を用いて式変形しているだけです。