• ベストアンサー
※ ChatGPTを利用し、要約された質問です(原文:主成分分析について)

主成分分析について

このQ&Aのポイント
  • 主成分分析を行い、主成分ベクトルを求めるためには行列の固有値問題を解く必要があります。
  • 固有値行列の固有値の値から累積寄与率を求め、適当な次元まで次元を減らします。
  • 次元を減らすと固有ベクトルの成分の数も減りますが、具体的な方法については質問者もわかっていません。

質問者が選んだベストアンサー

  • ベストアンサー
回答No.4

私は応用統計の学位があり,企業でSQCを推進する立場にある者です. 他の方の回答を見ていたら,求められる回答になっていませんでしたので, 私から回答します. 最初,主成分分析に使う変数は,100次元(100変数)あるとします. それをスペクトル分解して,50変数あれば大方の説明が付くことが分かったので, 次の調査からは,コストダウンのために,調査する変数を減らしたい. どのような基準で減らせばいいですか? という質問ですね. 基準は2つあります. (1)大きな固有値を持つ主成分軸(3~5くらいまで,あるいは累積寄与率を見て判断)の 固有ベクトルを見て,固有ベクトルの絶対値の小さいもの(それらの主成分に効いて いないもの)を順に除去していく. (2)小さな固有値(おしりの方)を持つ主成分軸の固有ベクトルを見て, 固有ベクトルの絶対値の大きいもの(これらの変数間には線形制約があって説明には 寄与していない)を順に除去していく. それぞれの考え方は, (1)はマハラノビス・タグチの変数選択方法に類似です. 重要な変数は残す!という考え方です. (2)は,重回帰分析において,説明変数間に多重共線性が出ているときと同じで, 説明に寄与していないのだから,その変数は取り除いても良いという考えです. ただし,変数間の共分散性は時に興味深い情報を含んでいますので, 残しておいた方が,なんらかの変化があったときに反応することが考えられます. 私は,(1)を推奨します.

その他の回答 (3)

  • hrsmmhr
  • ベストアンサー率36% (173/477)
回答No.3

100個の変数からなる50個の1次式を新たな変数とみなせばよいのです。 (a_ij)^T 1<=i<=50を固有ベクトル、{x_j} 1<=j<=100を分析する変数として {X_i=Σa_ij*x_j} を新たな変数とみなします データのばらつきがそのX_iの軸上に大きくばらけるので、ばらついた状態が分かりやすくなります 固有ベクトルの次数は減りません たまたまそのベクトルの係数のいくつかが0(もしくは0近く)になる場合だけ減ったように見えますが

  • alice_44
  • ベストアンサー率44% (2109/4759)
回答No.2

ベクトルの数を100から50に減らしても、 各ベクトルは100次元のままです。 「成分」と「成分」がゴッチャになっていませんか?

回答No.1

主成分分析は重要なものを知りたいので、固有値の小さいものから減らしていけばいいです。

関連するQ&A