- ベストアンサー
共分散で分かること
文系ですが、今ゼロからシリーズの統計確率を読んでいます。その中で共分散という言葉がでてきます。その式は C(X,Y)=E(XY)-E(X)E(Y) というもので、その解説の前の問題で 赤球3個、白球2個、青球1個 計6個より無作為に2個取り出すとき、赤球の個数をX、白球の個数をYとして ちょうど 、上の式 共分散の式で、値が、-4/15 とでています。 これで何が分かるのでしょう その前の問題では、同時確率分布、周辺分布ほ求めていますが、これは、理解できます。
- みんなの回答 (3)
- 専門家の回答
質問者が選んだベストアンサー
x=X-E(X) y=Y-E(Y) とおくと、xとyは平均が0の分布になります。 E(xy)=E(XY)-E(YE(X))-E(XE(Y))-E(E(X)E(Y)) =E(XY)-E(X)E(Y)=C(X,Y) ということで、E(xy)は共分散です。 E(xy)が正だということは、x>0 and y>0 であったり、x<0, y<0であることが多いことを意味します。xy座標でいうと、第1象限、第3象限の点が、共分散を大きくするのに寄与します。それも、原点から遠い点ほど寄与が大きくなります。 E(xy)が負だということは、x>0 and y<0 であったり、x<0, y>0であることが多いことを意味します。xy座標でいうと、第2象限、第4象限の点が、共分散を小さくするのに寄与します。それも、原点から遠い点ほど寄与が大きくなります。 ということで、共分散が正であることは、Xが大きくなるとYも大きくなる傾向があることを示します。共分散が負であることは、Xが大きくなるとYが小さくなる傾向があることを示します。 ご質問の例では、取り出す球の個数は2個と限られていますので、当然ながら、赤が増えれば白が減る、白が増えれば赤が減るという傾向があります。共分散が負であることは、この傾向を反映しています。 共分散を、Xの標準偏差とYの標準偏差で割ったものを相関係数といい、X・Yのスケールに影響されないので、XとYの関係を把握するのに便利です。
その他の回答 (2)
- shkwta
- ベストアンサー率52% (966/1825)
No.2です。 訂正します。 4行目の最後の符号はプラスです。 E(xy)=E(XY)-E(YE(X))-E(XE(Y))+E(E(X)E(Y))
- sunasearch
- ベストアンサー率35% (632/1788)
簡単に言うと、 E(XY)が大きくなると、C(X,Y)も大きくなりますので、 XとYが同時に大きな値を取るほど、その平均であるE(XY)ならびに共分散C(X,Y)が大きくなります。 そのため、二つの変量X,Yの間の相関関係を調べることができます。
お礼
参考ページありがとうございます。意味するところ、わかったような気がします。なにしろ、難しいですね
お礼
分散の1種であることは、なんとなく想像していたのですが、たとえで、負の傾向の意味が分かりました。そういえば、正の相関、負の相関というのが、ありましたが、すっかり、忘れていました。最後まで読めば、意味がつながるのかも、しれませんか。ありがとうございます