• 締切済み

行動パターンをグルーピングする統計分析の方法

数十社分、各社数十個の属性データ(金額等の数値)を時系列で年次5年分あります。 この属性データをもとに幾つかの会社のグループに分けられる行動パターンが分析できないかと思案しています。 この場合のパターンとは例えば各種資産の持ち方の時系列での推移がAグループとBグループで異なる傾向がある等です。 単純な相関分析では属性間の相関しかみれず、各社の行動パターンのグルーピングも出来ない気がします。 この場合適切な統計分析の方法を教えて下さい。よろしくお願いします。

みんなの回答

  • ramayana
  • ベストアンサー率75% (215/285)
回答No.1

基本的には、データと対話するしかないでしょう。あるやり方を試してみて、それが思わしくなかったら別のやり方を考える、ということを繰り返すのです。 グルーピングといえばクラスター分析がまず浮かびますが、解釈の苦しい結果に終わることもありがちです。手始めに、こんなのはどうでしょうか。 1 データを単純化するため、ひとまず時系列を無視し、各属性の5年間の平均を使うことにする。 2 平均を使うにしても、属性が数十個あると扱いにくいので、主成分分析により、主成分2つだけ抽出する。各会社の属性を、この2つの主成分に回帰する(主成分スコアを求める)。 3 主成分を2つに絞ったことにより、各会社の主成分スコアを平面上にプロットできる。そのプロット図をみて、グルーピングの見当をつける。そのうえで、2つの主成分だけを使ってクラスター分析でグルーピングする。あるいは、第1象限、第2象限、第3象限、第4象限と4つにグルーピングする。 4 元の数十個の時系列データに戻って、グループごとの特徴(増加/減少や、景気指標との相関など)があるかを確かめる。

kumatotoro
質問者

お礼

ありがとうございます。 時系列推移と属性項目の二つをみてグルーピングする手法を知らないので参考になりました。 確かにクラスター分析で意味ある結果と説明力があるかは分かりませんね。 地道にデータと対話してみます。