• 締切済み

主成分分析の変数の減らし方

主成分分析の変数の減らし方についてです。 現在サンプル数200程度、変数30個→5個程度に絞ろうと思っています。 累計寄与率を出すところまではサイトも充実しており理解できたのですが、そこからの変数の減らし方が載っているサイトがほとんどなく分かりません。 数式だけですと理解が難しい面もあるので、できれば具体例を挙げてイメージしやすいもので教えていただけると有難く思います。 サンプル数、変数共にそんなに高いものでなくて結構です。 よろしくお願いいたします。

みんなの回答

  • alice_44
  • ベストアンサー率44% (2109/4759)
回答No.2

変数を減らす? 何か勘違いをしていませんか。 主成分分析では、変数ではなく、次元を減らすんですよ。 第1~第5主成分を基底に持つ座標系へ変換してから、 寄与率の小さい成分は捨てるということ。 もとの30個の変数の中から、変数を5個に絞ったりすれば、 どんな選び方をしても、重要な情報が損なわれる可能性大です。

回答No.1

統計ソフトに固有値・固有ベクトルの表示機能があると思います. 固有値の大きなものから第1主成分,第2主成分となっていることは ご存知ですね. 固有ベクトルは,それぞれの成分への寄与の大きさを示しています. 変数の削除の考え方は2とおりあります. (1)大きな固有値を持つ主成分1~3ないし4までに 寄与していない変数を取り除く. (2)小さな固有値(ほとんど0)に大きな寄与を持つ 変数を取り除く. 主成分分析は,情報の縮約ですから,変数を取り除く必要はありませんが, 今後,同じような調査をするときに効率化したいというのであれば, 取り除く意義はあると思います.