- ベストアンサー
統計の平均と2乗の平均に関する質問
- 確率変数X_iはx_iと(1-x_i)の2値をとります。E[X_i]とE[X_i^2]を表すために使用できるのか質問です。
- E[X_i] = 2E[x_i^2] - 2[x_i] + 1、E[X_i^2] = 3E[x_i^2] - 3[x_i] + 1という答えが得られましたが、それぞれについての違和感があります。
- E[X_i]やE[X_i^2]の求め方について考える中で疑問が生じ、解答を求めています。
- みんなの回答 (5)
- 専門家の回答
質問者が選んだベストアンサー
- ベストアンサー
質問を解釈してみましたがこれで合ってますか? (記号を少し変えてあります。) (1) Q(小文字x_iに対応)というのが[0,1]上の確率変数。 (2) Q=qの時の確率変数X(大文字X_iに対応)の条件付き分布はP(X=q|Q=q)=q、P(X=1-q|Q=q)=1-q。 (3) このときX、X^2の(条件付きでない)期待値が知りたい。 しかしそうすると1つ疑問なのですが、Q=1/2のときのXの条件付き分布は(2)だけでは決まらないのでは。 もしP(Q=1/2)=0ならこれは問題にならず、 E(X)=E[E(X|Q)](E(X^2)=E[E(X^2|Q)])と書けるから、 E(X)=E(Q^2+(1-Q)^2)=2E(Q^2)-2E(Q)+1、 E(X^2)=E(Q^3+(1-Q)^3)=-E(Q^3)+2E(Q^2)-2E(Q)+1。 あとここまでの内容と関係ないですが、E(aX+bY)=aE(X)+bE(Y)は XとYが独立でなくても成り立つと思います。
その他の回答 (4)
- alice_44
- ベストアンサー率44% (2109/4759)
なんか、問題が変わったみたいだけど… A No.3 補足の問題は、質問の問題と同じには見えません。 気を取り直して、新しいほうの質問に答えてみます。 X_i たちが、独立に X' の分布に従うのであれば、 前にも書いたように、独立分布に対する E の線型性 E[ aX_i + bX_j ] = a E[X_i] + b E[X_j] (i≠j) から、 E[ (1/n)Σ(X_i)^k ] = (1/n) Σ E[(X_i)^k] = (1/n) Σ E[(X')^k] = (1/n) n E[(X')^k] = E[(X')^k] です。 k = 1 のときは E[ (1/n)ΣX_i ] = E[X'], k = 2 のときは E[ (1/n)Σ(X_i)^2 ] = E[(X')^2] ですよ。 E[ (1/n)ΣX_i ] = 2E[X'] - 2E[X'] + 1 には、ちょっとなりそうにない。その式は、 A No.3 とも違うけれど、どこから出た式でしょうか? よく判らないけど、あるいは、分散の計算 V[ (1/n)ΣX_i ] = E[ { (1/n)ΣX_i - E[(1/n)ΣX_i] }^2 ] = E[ { (1/n)Σ(X_i - E[X']) }^2 ] = E[ (1/n^2)Σ(X_i - E[X'])^2 + (1/n^2)2Σ[i<j](X_i - E[X'])(X_j - E[X']) ] = (1/n^2) Σ E[ (X_i - E[X'])^2 ] + (2/n^2) Σ[i<j] E[ (X_i - E[X'])(X_i - E[X']) ] = (1/n^2) n E[ (X' - E[X'])^2 ] + (2/n^2) Σ[i<j] CoV[X_i.X_j] = (1/n) V[X'] + 0 あたりと、混同があるのかなあ?
お礼
本当に自分の頭の中で勝手に脳内変換された問題書いてしまって 申し訳ありませんでした. また自分のミスがあり,その式には 「^2」が抜けてました. 本当に何度もすいません... 自分の中では以下のように解釈してたのですが,間違ってますか? E[X_i] = {x_i * x_i + (1-x_i) * (1-x_i)} = {x_i^2+(1-x_i)^2} = 2x_i^2 -2x_i +1 E[1/nΣX_i]=(1/n)E[X_0 + X_1 + …] =(1/n)Σ 2x_i^2 -2x_i +1 =2E[X'^2] - 2E[X'] + 1 えっと,とりあえず,おそらく私の感覚だと この問題の場合,ΣX_i = X’ ではないので 回答者様のような結果にはならないと思っていたのですが... できれば, (1/n) Σ E[(X_i)^k]= (1/n) Σ E[(X')^k] の部分について詳しく教えてください. 自分では納得したつもりでしたが,間違えてる可能性が出てきたため 掲示板の締切も延長したいと思います.
補足
誤解されている点が分かりました. 本当に日本語能力がなくて申し訳ありません. もう一度,自分が意図している問題を頑張って書きます. ある確率変数X’が存在して,確率密度関数(または確率関数)が定義されてるとします. この確率変数に従う乱数によりn個の数を生成します. これをx_0,x_1,....,x_n-1とします. これらの数値x_0,x_1,...を基にして,確率変数X_0,X_1,...を定義します. このときのX_iの定義が,P(X_i=x_i)=x_i,P(X_i=1-x_i)=1-x_i となります. (この最後の文が抜けていました.) この時,E[X'],E[X'^2],E[X'^3]...が与えられていると仮定した場合,これらを用いて E[X_i]とE[X_i^2]が求めることはできますか?という問題です No.5様が私の意図している問題をちゃんとした数学的な表記で 書かれていると思うので,そちらを参考にしていただいた方が早いかもしれません.
- alice_44
- ベストアンサー率44% (2109/4759)
個々の X_i の確率分布が何であるかよりも、 添字の異なる X_i と X_j (i≠j) が独立であるかどうかが大切。 独立であれば、E(X_i + X_j) = E(X_i) + E(X_j) だから、 E((1/n)ΣX_i) = (1/n)ΣE(X_i) = (1/n)Σx_i となる。 独立でなければ、X_i たちの結合確率分布についての情報が必要になる。
お礼
事象としては独立だと思います. No1さまの回答欄にも書いたんですが, 自己の再確認の意味を含めてもう一度書いておきます. ある確率変数X’が存在して,確率密度関数(または確率関数)が定義されてるとします. この確率変数に従う乱数によりn個の数を生成します. これをx_0,x_1,....,x_n-1とします. これらの数値x_0,x_1,...を基にして,確率変数X_0,X_1,...を定義します. この時,E[X'],E[X'^2],E[X'^3]...が与えられていると仮定した場合,これらを用いて E[X_i]とE[X_i^2]が求めることはできますか?という問題です. ちなみに,質問文のE[x_i]はE[X']の意味合いで用いています. 誤表記申し訳ありません. この場合は独立だと思っていたので,同時確率密度関数は算出していなかったのですが, 大丈夫でしょうか? また,alice_44様の意見だと結局E[X']を用いて表すと, E[(1/n)ΣX_i]=2E[X']-2E[X']+1 という解釈でよろしいでしょうか?
補足
もともとは,x_iは単なる数字ではなく,確率変数のように用いたつもりだったのですが, たとえそうだとしても,質問文みたいな表記はないということが分かり,勉強になりました. 問題の再定義は補足欄に書いた通りです. とりあえず,回答者様たちの意見を元に考えてみた場合, 元々の質問文に書いた回答であっているという見解になりました. 今から1日後に回答を閉め切ろうと思います. 間違い等あればご指摘ください! ご回答ありがとうございました!!
- alice_44
- ベストアンサー率44% (2109/4759)
X_i の確率分布に関する「平均」と 添字 i による算術的な「平均」が ゴッチャにされており、何がしたいのか よく解らない。
お礼
質問者です. 回答ありがとうございます. とりあえず,私の中では確率変数X_0,X_1,... (同一の分布に従うとは限らない)が存在して, それらすべての確率変数の平均?がE[X_i]のつもりです. そしてそれらの2乗和の平均がE[X_i^2]のつもりで使っています. とりあえず書き方が分からないのですが,これであっていますか? 勉強不足で申し訳ないです.
- rabbit_cat
- ベストアンサー率40% (829/2062)
とりあえず、記法は『ものすごく』変です。。 >確率変数X_iはx_i と(1-x_i)の2値をとることができ,P(X_i == x_i) = x_i,P(X_i == 1-x_i) = 1-x_i とします. >この時,E[x_i] ,E[x_i ^2] …が存在すると仮定できる場合,これらを用いてE[X_i]とE[X_i^2]を表すことは可能ですか? まず、確率変数はX_iであって、x_iは単なる数字ですから、E[x_i]ではなくて、E[X_i]です。そして、0≦x_i≦1 とすれば、定義から E[X_i] = x_i^2 + (1-x_i)^2 E[X_i^2] = x_i^3 + (1-x_i)^3 と簡単に計算できます。(当然、存在します) このとき、 E[(1/n)Σ_{i=0}^{n-1}X_i] = (1/n)Σ_{i=0}^{n-1} E[X_i] = (1/n)Σ_{i=0}^{n-1} {x_i^2 + (1-x_i)^2} です。
お礼
もともとは,x_iは単なる数字ではなく,確率変数のように用いたつもりだったのですが, たとえそうだとしても,質問文みたいな表記はないということが分かり,勉強になりました. 問題の再定義は補足欄に書いた通りです. とりあえず,回答者様たちの意見を元に考えてみた場合, 元々の質問文に書いた回答であっているという見解になりました. 今から1日後に回答を閉め切ろうと思います. 間違い等あればご指摘ください! ご回答ありがとうございました!!
補足
回答ありがとうございます. 自分でもどう書けばいいのかわからないのですが, ある確率変数X’の実測値?としてx_i が存在します. そして,その実測値に対応するX_i を考えている...といったところでしょうか. 例えば,ある分布に従う確率変数X'が存在するとします. その確率変数を何回か計測?して,実数値x_0,x_1,....,x_nが得られたとします. その計測された実測値に対して,質問文の確率変数X_0,X_1,...を考えます. その時,そのすべての確率変数X_iの和の平均(または2乗和の平均)は元のX'の平均等を用いて表せますか?という質問です. なので,質問のE[x_i]はE[X']と同義で用いていると解釈していただけたら多分大丈夫です. これで書き方があってるのかよくわかりませんが,よろしくお願いします.. 誤表記申し訳ありませんでした.
お礼
すごいです,まさにこの通りです. こう書かれると本当に統計って感じします! 問題はもともと自分で作った(というより,ある問題をモデル化して考えたらこうなった)のですが, 自分でどうやって統計的に表記してよいのかわからなかったため, とても参考になりました. 回答者様の回答に理解がついていっていないのですが, 「Q=1/2のときのXの条件付き分布は(2)だけでは決まらない」 とあるのはこれは 「P(X=q|Q=q)=q、P(X=1-q|Q=q)=1-q」 の定義から,X は 1/2 の値しかとりえないのに,その確率が1/2となるからですか? こういう曖昧性が含まれる場合は基本的に未定義扱いされるのですか? あと, 「E(X^2)=E(Q^3+(1-Q)^3)=-E(Q^3)+2E(Q^2)-2E(Q)+1」 の式が自分の算出した式と少し違うみたいなので, よろしければ式変形等を 少しでも書いていただけるとありがたいです. 独立性は期待値の線形性とは関係なく, P(XY)=P(X)P(Y) のみでしたっけ? とりあえず,勉強不足が分かりました. 勉強しなおします.