• 締切済み

2次元以上のデータの分散の計算の仕方

分散の求め方として,  σ2=1/(n-1)Σ(x-mean(x))^2  http://ja.wikipedia.org/wiki/%E5%88%86%E6%95%A3#.E6.A8.99.E6.9C.AC.E5.88.86.E6.95.A3 という式で求めるわけですが,xが1次元の場合はこれで計算すればいいと思いますが, 3次元以上の場合は,どう求めたらいいのですか? また,2次元の場合の分散として,σxx,σxy,σyy の3種類を求めることができる わけですが,データの散らばりが小さい(より小さい半径の円の中に収まる) 度合いを測るには,σxx,σxy,σyyのどれを使うべきなのでしょうか? σxxは,xの平均値から最大値までの長さ σyyは,yの平均値から最大値までの長さ だと思うのでこれがデータを収めるための円の半径になる気がしているので, max(σxx,σyy)で散らばりを測るのがいいのかと考えています。 しかし,σxyが幾何的に何を表しているのかイメージできないのでどれを使うべきか迷ってます。

みんなの回答

  • rabbit_cat
  • ベストアンサー率40% (829/2062)
回答No.1

n次元の分散は、n×nの対称行列になります。共分散といってます。 日本のWikipediaのページはいまいちなので、英語版ですが、定義も載ってます。 http://en.wikipedia.org/wiki/Covariance 質問の後半ですが、 つまり、x、yの平均がともに0である場合について言えば、 x' = xcosθ + ysinθ y' = -xsinθ + ycosθ みたいな変数変換をしたときに、(θをいろいろ動かしたときの)、x'の分散の最大値を知りたい、ていうことですか? σx'x' = (sin^2θ)*σxx + (cos^2θ)*σyy + σxy*2sinθCosθ ですから、これの最大値を求めればいいですね。 高校知識で真面目にやってもいいですし、2次形式なんで適当に処理してもいいです。

nekome___
質問者

補足

補足用のブログを作成しました。 以下のサイトを見て回答お願いします。 http://dataputon.seesaa.net/article/109696533.html

すると、全ての回答が全文表示されます。

関連するQ&A