• ベストアンサー
※ ChatGPTを利用し、要約された質問です(原文:3変量の分散についての質問です.)

多変量の分散についての質問

このQ&Aのポイント
  • この質問は、多変量の分散についての対応方法を尋ねています。具体的には、あるサンプル群の色のRGB値を比較する方法について知りたいと述べています。
  • 質問者は、3変量の分散を計算する方法と、分散ベクトルや共分散行列を利用して比較する方法について具体的なアドバイスを求めています。
  • 質問者は、3変量の分散を計算するために、他のサンプル群との比較を考えています。しかし、どのように比較すれば良いかわからない状況であり、アイデアを求めています。

質問者が選んだベストアンサー

  • ベストアンサー
回答No.2

重心からの距離との提案ですが,少し追加があります. 単なるユークリッド距離ではなく,相関を考慮して求めた距離の2乗値のことを マハラノビスの汎距離といいます. マハラノビスの汎距離は,相関係数行列,分散共分散行列のいずれから求めても その期待値は次元数と一致します. 個々の観測点のばらつき(重心に近いか遠いか)の指標にはなりますが, 群の平均は常に同じ(3次元なら3)になり,群間の比較にはなりません. ですから,1群,2群,3群をプールしてマハラノビスの汎距離を求め, 群毎の平均で比較することが良いと思います. 次に,事例に上がっている「身長,体重」ですが, 群のばらつきをどうとらえるかと視点で,良いヒントがあると思います. 身長と体重にはもともと相関があって,関係線がが引かれます. (個々の標本から関係線に下ろした垂線の長さの2乗和を最小にしたもので主成分線と言われます) ・群のばらつきとは,重心からの分布の楕円の大きさである ・群のばらつきとは,身長依存分を除いた肥満度である 前者は,マハラノビスの汎距離 後者は,垂線の長さ と考えることができます. 例えば,エクササイズの実施群/非実施群の違いを見るとき,前者では効果無しとなるでしょう. エクササイズでは身長を変えることができないからです. (同じ身長の者だけ集めて,2群に分ければよいですが,身長によって効果が違うのではないか という点に関して疑義を生じます) つまり,RGBの観測値の中には,もともとブライトネス(サイズファクター), コントラスト(シェイプファクター)があって,それには身長体重のような 一定の関係があるとします. それは,撮影対象物あるいは撮影環境や設定値に依存し, 撮像素子や変換器のばらつきではないので,除く必要があります. もちろん,それらの前提を固定して測定すればいいのですが, 他のケースにおいて,効果が違うのではないかという疑義が生じるので, いくつかの観測点をサンプリングしています. すると,3次元空間内に横たわる一定の平面(身長,体重の3次元版)が形成され, それに下ろした垂線の長さの2乗和がその群のばらつきであると考えることが できます. 通常,誤差は正規分布をとりますが, このような(距離^2)はχ2乗分布となります. 後者のばらつきは,相関係数行列の最小固有値に一致します. このときは,全体をプールせず,各々求めればいいです. ただ,最小固有値の固有ベクトルが平面の法線ベクトルを与えていますので それが,群毎に著しく違うことが無いということを確認しておく必要はあると思います.

dmsxd
質問者

お礼

ありがとうございます! http://gucchi24.hp.infoseek.co.jp/HANBETUEX.htm 上記のサイトを参考に行ってみました. 助かりました!!

その他の回答 (1)

回答No.1

3変量を3次元空間での距離とおく考えはどうでしょう。 1変量の分散は、直線上の各点とその重心点(平均点)の距離の2乗の平均です。 2変量の分散は、平面状の各点とその重心点の距離の2乗の平均。 同様に3変量の分散は、直行するR軸、G軸、B軸の空間に位置する各点とその重心点との距離の2乗の平均とする。 今回の例題のように、RGBが同じ性質(単位)の数値あれば、この考え方でよいと思います。 身長と体重のように、単位が異なると分散の意味があるのかどうか? たとえば、「身長がほぼ同じで、体重がばらついている郡と、身長はばらついているが、体重はほぼ同じ郡を比較して、分散が同じだったら、ばらつきが同じとである」といっても意味がない。

dmsxd
質問者

お礼

なるほど!! 今回の場合だと適用できそうです!! ありがとうございます!

関連するQ&A