• ベストアンサー

相関行列による主成分分析

変量がp個の場合の主成分分析で、相関行列(の二乗和)に着目した時の話です。 この時の、第二主成分を求める手順、式変形、式変形が成り立つ理由がいまいち理解できません。 主成分分析、あるいは多変量解析の教科書は複数冊に目を通しているのですが、理解力が足りないようで…。 うまく説明できる方、宜しくお願いします。

質問者が選んだベストアンサー

  • ベストアンサー
  • qqtester
  • ベストアンサー率66% (10/15)
回答No.1

相関行列に着目する場合は、分散(データの散らばり、二乗和)に着目します。 第1主成分P1は、データXの分散の最も大きい方向を示しています。(P1の計算方法は省略。) この時点で、第1主成分に対するの係数A1は、第1主成分方向との内積A1=X×P1/|P1|として得られます。 第2主成分P2は、第1主成分方向を除いた(ゼロとする)場合の残りのデータ(X2 = X-A1×P1/|P1|)の分散の最も大きい方向を示します。(P2の計算方法は省略。) ポイントは、このときのデータX2が、p個の変量で表している座標をp-1個の新たな変量(第2~p主成分に相当)で表せる状態にあることです。 第2主成分に対する係数A2は、第2主成分方向との内積A2=X2×P2/|P2|(=X×P2/|P2|:P1×P2=0より)として得られます。 第3主成分以降も第2主成分と同様の手順で順次求めることができます。 第p主成分までもとまれば、データXを係数Aと主成分Pで X =A1×P1+A2×P2+...+Ap×Ppであらわせます。

type-RRR
質問者

お礼

ありがとうございます! 理解が深まりました。 さらに勉強を続けていきたいと思います。