• ベストアンサー

因子分析の因子負荷量について

因子負荷量がよくわからないのですが、負荷量が大きいということは、その項目の重要度も大きいということでしょうか? その因子をより説明している、と聞いた気もするのですが、説明している、というのがよくわからないんです… 5件法で聞いて5が多かったり1が多かったりすると 大きくなったりするのでしょうか? 寄与率についても曖昧な知識しかありませんので、わかりやすく教えていただけるとありがたいです。

質問者が選んだベストアンサー

  • ベストアンサー
  • selfer
  • ベストアンサー率76% (104/136)
回答No.3

bon-chanさん,こんにちは.意欲的に統計法の質問をされていますね. 正統的説明はtem546さんがされていますので,その中継ぎとして,不正確ですがもう少し初心者向けの説明をしたいと思います. 因子分析を単純に言ってしまえば,「複数の変数を,更に少数の【類似した】変数群にまとめるための【視点】を提供する」となります. 例えば次の相関行列を参考にして,「科目A~D」の五つの変数を,類似したもの同士をまとめる際の視点は何かを探ります.   ── 科目ABCDEの相関行列(架空):1 ────────        科目A  科目B  科目C   科目D  科目E    科目A  1.00   -0.34   0.98   -0.44   -0.24    科目B -0.34   1.00  -0.34   0.53   0.63    科目C  0.98   -0.34   1.00   -0.35   -0.32    科目D -0.44   0.53  -0.35   1.00   0.54    科目E -0.24   0.63  -0.32   0.54   1.00   ───────────────────────────── かなり露骨な相関行列なので因子分析を使わなくとも何とかなります.この相関行列を,数値が低いものを消して,あれこれ並べ替えてみると,   ── 科目ABCDEの相関行列(架空):4 ────        科目A 科目C 科目B 科目D 科目E    科目A 1.00  0.98    科目C 0.98  1.00    科目B         1.00  0.53  0.63    科目D         0.53  1.00  0.54    科目E         0.63  0.54  1.00   ───────────────────────── となり,「科目A&C」と「科目B&D&E」という二つの「視点」がみつかりました.この「視点」こそが,因子分析における「因子」です. 因子分析の本来の目的は「因子は何個あるのか?」を探ることでした.無論,一番上の相関行列を見て,「いや,例え相関係数が0.6であっても,両者は違うんだっ!」とこだわりさえすれば「科目B&D&E」は同じ因子にはならないでしょう.この辺は分析者の主観によります. やがて因子分析を使う人達は,「因子は何個?」という目的だけに満足できずに「それぞれの因子の【内容】についても知りたい」という少し贅沢な要求を出してきました. この要求は統計を実践で使う人から提出されたものですが,理論家からすれば「それは本来の使い方じゃないから厳密には内容を特定は出来ないんだがなあ」と思わせるものです.とはいえ,理論家は実践家に対してアドバイスを与えます.「因子負荷量に注目すれば因子の内容を(ある程度)特定できるよ(,絶対的じゃないけどね)」と. 一番最初の相関行列を因子分析にかけます.   ─────────────────────────      主因子法・バリマックス回転後の因子負荷量            因子1  因子2  共通性        科目A -0.20   0.98  1.00        科目C -0.20   0.97  0.98        科目B  0.84  -0.17  0.74        科目D  0.75  -0.29  0.65        科目E  0.87  -0.09  0.77        固有値  2.12   2.01        寄与率 42.36% 40.26%      累積寄与率 42.36% 82.62%   ───────────────────────── このような結果になります.この因子分析結果では二因子解を採用しています. 因子負荷量とは何か? 少し間違った言い方をすれば「因子と項目との間の【相関係数】」……そう考えてもらって構いません.少なくとも直交回転における因子分析ではこの考えはそれほど間違っていないと思います(正確な解釈はtem546さんの説明を参考にして下さい). では上記の結果から「因子1」と「因子2」の内容を特定しましょう.このままでは特定化できないので以下の情報を提供します(なお上記データは全て架空です). ・科目A:数学 科目C:理科 ・科目B:英語 科目D:国語 科目E:社会 いま,「因子2」というのは「数学と理科」科目の項目と,非常に関係が強い(高い相関係数).因子負荷量からそれが読みとれますね? 因子負荷量というのは「重要度」というよりは「関係の強さ」と考えてもらった方が分かりやすいと思います. 因子というのは,関連する複数の項目(数学と理科)に「共通する要素」なわけですから……数学と理科の共通の要素とは何でしょうか? まあどのような名称を与えるかは分析者の命名センスにかかっていますので,ここでは「理系的学力」とします.結果,「因子2=理系的学力」となります.同様に「因子1=文系的学力」となるでしょう. とりあえず,因子負荷量に関して,使い方に関連した部分だけ簡単に説明させてもらいました.以上の説明を読んでもらって,改めてtem546さんの説明を読んで下さい.私が誤魔化している部分をより正確に説明していらっしゃいます. 最後に,一番最初の相関行列からの説明でわかるように,因子分析というのは「相関係数」を元にしています. 相関係数というのは御存知の通り,一つの変数がどうこうではなく,【二つの変数間の関係】を示しています. >5件法で聞いて5が多かったり1が多かったりすると >大きくなったりするのでしょうか? 【直接的には】なりません. あくまでも二変数関係に注目するものですから,一つの変数が5に集中したからといって因子負荷量が大きくなったりするわけではありません. ただし……ある変数Aがたいてい5であり,別の変数Bがたいてい5である場合,「AとBとには同じ5になろうとする関係だ」となります.この意味で間接的に「5が多ければ……」因子負荷量が大きくなることがあるかもしれません(これは自分で考えてみて下さい).

bon-chan
質問者

お礼

ありがとうございます。 何度も質問してるのバレバレですね f(^^; お恥ずかしい… わかりやすいように、会話形で説明していただけて、なんだか因子分析になじみが出てきました(笑)単純すぎですかね? 人見知りから、ちょっと友だち、みたいなかんじになってきました(笑) 因子を何個にするか、というところまではいいのですが、 「贅沢な要求」がくせ者ですね。 でも、かなりかみ砕いていただけて、少しは理解できるようになったと思っています。 統計が苦手な人用の本でも買って、本とここでいただいた回答を見ながら勉強し直します。 ありがとうございました!

その他の回答 (2)

  • tem546
  • ベストアンサー率51% (14/27)
回答No.2

うーん、より簡単に言うと、因子負荷量とは「因子にどれくらい影響を受けるか」という事です。 例えば「社交性」「指導力」「思考力」「引っ込み思案」という変数があって、 その背後に「外向性」因子というものがあるとします。 「外向性」因子は「社交性」「指導力」には正の負荷量が高い、 つまり「外向性」因子が強ければ「社交性」「指導力」変数が高く現れるわけです。 対して「思考力」変数は「外向性」因子の負荷量が低い、 つまり「外向性」因子が強かったとしても「思考力」変数にはそれほど影響が無いという事になります。 「引っ込み思案」変数は逆に「外向性」因子と負の負荷量を示す、 つまり「外向性」因子が強ければ「引っ込み思案」変数は低く現れる事になります。 で、「その因子をより説明している」という事ですが、 前にも書いた通り因子分析とは変数間に潜む共通因子を見つけ出すという分析法なのですが、 その分析結果は 因子1の因子負荷量 変数1 0.55 変数2 0.25 変数3 -0.86 という感じになって出るだけです。 この因子に「外向性」などの意味付けを行うには、 変数と因子負荷量を見て自分で考えないといけないのです。 この時に因子負荷量の強い変数はその因子に占める割合が高いため、「説明力がある」といいます。 ちなみに「説明力」とは統計においてかなり重要な用語です。 もっと簡単な相関係数における分散説明率から勉強した方がよいと思いますが・・・ 因子分析は統計を勉強してない方が行うには手に余る分析法ですよ。

bon-chan
質問者

お礼

ありがとうございます。 一応統計は去年勉強していたのですが、かなり手に余ってます f(^^; 因子分析は統計の先生が直接教えてくれたわけではなく、先輩から聞いたのですが、その先輩も「俺もよくわかってないんだよね~」と言っていたのでなんだかあまり聞けないままでした。 もっと基礎から勉強しなおします。 もっと統計の力があれば、tem546 さんの説明がすばらしいものだということがわかる気がします。 「説明力」もけっこう見聞きする用語ですが、まずこの意味からしっかり調べて覚えなきゃです。 ありがとうございました

  • tem546
  • ベストアンサー率51% (14/27)
回答No.1

因子分析とは、その変数全体に影響する因子を分析するものです。 例えばp個の観測変数Y1,Y2,Y3...,Ypに一つの共通因子Fのみを考えるとすると、 Yj=Bj×F+e (j=1,2,3...,p) という式になります。 ここでBjというのはそれぞれの変数が因子Fをどの程度反映しているかを示すもの、つまり因子負荷量です。 (当然、-1<Bj<1 ですね) ちなみにeは変数Yjに含まれる独自因子です。 しかし因子分析で出される因子そのものには何の意味付けもなされていません。 なので、分析者が自分でその因子に意味を付けなければいけません。 そのために「どの変数で負荷量が高く、どの変数で負荷量が低いか」という事が意味付けに重要になるため、 >負荷量が大きいということは、その項目の重要度も大きいということでしょうか? という事ではないです。 ちなみに寄与率とは一因子において各変数の因子負荷量の二乗和を変数の数で割ったものです。 これが高い程、その因子がデータをどれだけ説明できているか、という事になります。

bon-chan
質問者

お礼

う~ん・・・難しくてわからないです… 寄与率はなんとなくわかったのですが、負荷量がまだ… 負荷量の高低は何を表すのでしょうか?

関連するQ&A