- ベストアンサー
因子分析とクラスタ分析とセグメント判別の方法
- 30項目、10段階評価のアンケート設問を用いて、因子分析とクラスタ分析を行い、回答者をセグメントに分ける方法について質問があります。
- 具体的な手順として、元の回答者とセグメントを紐付け、回帰分析式を作成し判別する流れで進めることができます。
- 参考になるURLもご紹介しますので、ぜひご覧ください。
- みんなの回答 (2)
- 専門家の回答
質問者が選んだベストアンサー
手元にある本を見直してみたら、下記の本に因子分析等の空間付置を行う分析手法で時系列分析をどうするかという、まさに今回のテーマに近い解説がありました。 「入門 多変量解析の実際 第2版」 http://www.amazon.co.jp/o/ASIN/4061539639/ ※トラブルシューティングの項 クラスター分析の時系列適用も、似たような実例が載っていました。 ただし、ある程度手法の意味が分かっていないと、適用はできないかもしれません(数学的な手続きまで説明しているわけではない)。まあ、それほど高い本ではないので見てみてください。
その他の回答 (1)
- taba
- ベストアンサー率61% (349/567)
因子分析はデータの特徴を相対的な観点から抽出する手法ですので、別のサンプルセットに対して適用すると同一の結果にはなりません。分析の目的が良く分からないので一概には言えませんが、「同じロジックによってセグメント」することが重要である場合、因子分析を使うこと自体が問題とも言えます。 また、クラスター分析は(上の手続きでは)因子スコアを使ってたまたま4つに分けたのであり、同じ数のセグメントに分けるという考え方は誤っています(時間が経てば回答者は変化するわけで、違うセグメントを設定した方が適切であったり、そこまではいかなくても従来のセグメントからははずれたサンプルが出てくるのが普通です)。 従って、(2)の回帰という手法を採ることは考えづらいですね。 絶対的な正解はないと思いますが、因子分析に関しては 1)古いデータの因子スコアをそのまま利用する 2)古いデータと新しいデータをまとめたデータで再度因子分析する のどちらかが多いように思います。ただ、新しいデータだけで因子分析を行って、構造が大きく変わっていないことは確認しないといけないでしょう。 クラスター化に関しては、新しいデータだけでクラスタリングを再度行うか、新旧データでまとめてクラスタリングをやり直すか。また、古いクラスタリングを見ながら、重心からの距離等(最初のクラスタリングで使った手法にもよりますが)でどのクラスターに含めるかを恣意的に決めるかといったところではないでしょうか。
補足
仰るとおり、目的によっても異なりますね。 ご迷惑でなければもう少し、伺っても良いでしょうか。 後半でご指摘の「古いクラスタリングを見ながら、重心からの距離等・・・」というのが、今回、まさしく使いたい手法です。 ※回帰分析で云々、というのは見当違いであることを認識いたしました。 そこで、そのようなやり方の参考になるような書籍(手順や手法の教科書的なものですと幸いです)やURLをご存知でしたら教えて頂けますでしょうか? どうぞよろしくお願い致します。
お礼
迅速なる回答、誠に有難うございます!! 私自身、因子分析やクラスター分析はSPSSを使って「アルゴリズムを回してアウトプットを出す」という短絡的・単純的に日常的に使用しています。おおよその意義は理解しているつもりではありますが、今回のように、一度クラスタリングしたそのロジックを、他のサンプルに対して汎用的に再活用するということは、理解を超えておりました。 この度は説明不足にもかかわらず、懇切丁寧な回答をどうもありがとうございます。 また何かありましたら、是非、宜しくお願い致します。