- 締切済み
最大値分布の作成
最大値分布の作成 最大値分布に関する質問です。ある母集団からN個サンプルをとることを永遠に繰り返した時の、その最大値の分布を導出するのはどうしたらよいですか?Nが2の時、4の時、8の時と分けて3つの異なる分布を得たいです。 例えばある母集団の分布(平均6.3、標準偏差1.3)があり、ここから4個サンプルを取り出すとします。これが(5,9,6,4)だったとするとこの中の最大値は9です。このサンプリングを無限に行う時の最大値の分布はどのように計算できますか? この最大値の分布は1回のサンプル数の大きさに比例して大きくなると考えられますが、サンプル数が2の時、4の時、8の時の最大値分布の平均と標準偏差を求めたいです。 順序統計量の最大値の確率分布を用いるのかと思い調べたのですがよくわかりません。どうか知恵をお貸しください。よろしくおねがいします。
- みんなの回答 (3)
- 専門家の回答
みんなの回答
- ramayana
- ベストアンサー率75% (215/285)
X1、X2、・・・、XN を、独立で同一の正規分布に従う確率変数とします。その分布関数をF(x) とし、密度を f(x) とします。さらに、X1、X2、・・・、XN の最大値を Z とします。 Z の分布関数を H(z)、密度を h(z) 、平均をμ(Z) 、標準偏差をσ(Z) とします(混乱しないように、確率変数を大文字の X、 Z で表し、実数を小文字のx、 z で表した)。すると、次のようになります。 H(z) = F(z)^N h(z) = Nf(z)F^(N-1) μ(Z) = ∫[-∞ to ∞]zh(z)dz σ(Z)^2 = ∫[-∞ to ∞](z-μ(Z))^2・h(z)dz 例えば、X1、X2、・・・、XN が標準正規分布に従うとき f(z) = (2π)^(-0.5)exp(-z^2/2) F(z) = ∫[-∞ to z]f(t)dt です。 上の式を使って数値計算できないこともないですが、結構面倒くさそうです。およその値でよければ、正規分布に従う乱数を大量に発生させて、シミュレーションするのが簡単でしょう。Excelのワークシート関数なら、 NORMINV(RAND(),0,1) により、標準正規分布に従う乱数を発生させられます。計算してみると、次のようになりました(それぞれのケースで乱数を500,000×N 個発生させてシミュレーションした結果。数値には誤差がある)。 (X1、X2、・・・、XN が標準正規分布に従うとき) N = 2 なら、平均が 0.56 、標準偏差が 0.83 N = 4 なら、平均が 1.03 、標準偏差が 0.70 N = 8 なら、平均が 1.43 、標準偏差が 0.61 (X1、X2、・・・、XN が平均 6.3 、標準偏差 1.3 の正規分布に従うとき) 標準正規分布のときの平均に 6.3 を加え、標準偏差を 1.3 倍すればよい。 N = 2 なら、平均が 6.86 、標準偏差が 1.07 N = 4 なら、平均が 7.33 、標準偏差が 0.91 N = 8 なら、平均が 7.73 、標準偏差が 0.79 *********** 参考 [1] X と Y を、独立で、絶対連続な分布関数を持つ確率変数とする。それらの分布関数を F(x)、G(y) とする。 X と Y のうち大きい方を Z とする。 Z の分布関数を H(z) とする。すると、 H(z) = F(z)G(z) である(添付図参照。ただし、X と Y の密度をそれぞれ f(x)、g(y) とした)。 [2] X1、X2、・・・、XN を、独立で、絶対連続な同一のF(x) を分布関数に持つ確率変数とする。X1、X2、・・・、XNの最大値を Z とする。 Z の分布関数を H(z) とする。すると、 H(z) = F(z)^N である([1] を繰り返し適用すれば得られる)。
- MagicianKuma
- ベストアンサー率38% (135/348)
母集団から無作為に1個サンプルしたときのXの確率分布を連続型として、分布関数をF(x)=P(X≦x)とすると、 n個のサンプル(X1,X2,・・・,Xn)の最大値Yの分布関数G(y)は,X1~Xn全てがy以下になることと同じですから、 G(y)=P{(X1≦y)∧(X2≦y)∧・・・∧(Xn≦y)} X1,X2,・・・,Xnが独立として、 G(y)=F(y)^nとなります。Xの確率密度関数をf(x)とすれば、Yの確率密度関数g(y)はG(y)をyで微分して、 g(y)=dG(y)/dy=nF(y)^(n-1)・f(y)です。問題にもどると、上記Xの分布に正規分布を当てはめれば良い。 ですが、正規分布の密度関数をφ,分布関数をΦと書けば、 n=2の時、g(y)=2Φ・φ n=4の時、g(y)=4Φ^3・φ で平均や分散も定義に従って、∫yg(y)dy とかを計算すれば良いのだけれど、手に負えません。(私には) E(y)=μ+α(n)σ αはnの増加関数、V(y)=β(n)σ2 βはnの減少関数になるらしいです。
- MagicianKuma
- ベストアンサー率38% (135/348)
母集団の分布型が分からないと解けないのでは?
補足
すみません。正規分布です。