- 締切済み
尺度作成で因子分析の斜交回転を利用することは不合理では?
僕は、尺度作成で因子分析の斜交回転を利用することは不合理であり、尺度は直交のほうがいいと思うのですが、斜交回転が基本というのが最近の心理学の主流だということで、困っています。どうしたらいいでしょうか。 僕は、心理学者ではないのですが(理系で実学系の人間です)、最近ある分野での個人の特徴を示す尺度を作るために、心理学者の友人と一緒に仕事をしています。ネットで検索すると確かに最近の心理学では以下のような主張があるようです。 1. 直交するという前提に無理があって,たいていの要因は多かれ少なかれ相関している。直交回転では、心理学的な意味は、回転結果にはないと考えるべきである。 2.因子間相関の大きさを集団間で固定した解を計算するには、共分散構造分析を使用しなければならない。 しかしこれでは、共分散構造分析をできる人しか使えないような尺度になってしまうので、これらは本来モデル作成のための議論であって、そのモデルを離れて広く利用されるための尺度作成の議論ではないと思います。直行尺度なら、もっと簡単に扱えるので、尺度としての幅広い応用性があると思います。 たとえば、多重共線性を考えずに単純な重回帰分析にかけることもできます。それに関連した応用面を言えば、採否基準になどに合成得点を求める際も、因子に相関があると単純な加重和を求めることは無意味になります。 また、たとえば2次元の単純なマッピングを行ってセグメントを分けるということは人間がよくやることですが、これはそもそもその2次元が独立であることを暗黙の前提に行っていると思います。たとえば、地図を作る際に、方位が独立でない地図を作ったら混乱するでしょう。確かに、日本では北に行くほど東に行くので、東-西(表日本-裏日本)と東北-西南という2つの斜交する方位を使うと便利なような気がします。しかし、そんな地図はどこを探してもうっていません。利用者が誤解・混乱するからです。 多変量解析はアルゴリズムとしては単純なものですが、それでも最終的な利用者(結果レポートを読む実務家)には難しいもので、特に因子分析の解釈は最終利用者の誤解を招きやすいことは、実務の経験のある方ならよくご存知だと思います。利用者の誤解・混乱を助長するような斜交軸の利用は、避けるほうが賢明ではないでしょうか。 そもそも、直交するという前提に無理があるというなら、線形だという前提のほうがもっと無理があるでしょう。その場合は非線形な解析をするほうがいいのでしょうが、たとえば決定木分析を行うことを考えると、上位ノードで選ばれた因子と相関する因子は下位ノードで選ばれずに剪定されてしまう可能性が高く、複数の因子を準備する意味が希薄化します。 もちろん、因子付加量の高い項目を単純に足すことで各因子に相当する近似得点を簡単に求めることは、直行であれ斜交であれ、因子と項目の相関が十分に高ければできることです。しかし、その近似得点の使い方が簡単かつ意味のあるものでなければ、実務に供することができないと思うのです。TEGやBig Fiveがあれだけ広く使われているのも、直交尺度を提供しているからだと思います。実学・実務の観点から言えば、直行のほうがいいような気がしています。実際、日経などのメディアではいまでもバリマックス回転が主流のようです。 このあたり、どう考えたらいいかアイディアのある方お教えください。どうぞよろしくお願いします。
- みんなの回答 (13)
- 専門家の回答
みんなの回答
- sironokabe
- ベストアンサー率67% (19/28)
変数名を抽象化したデータが何を示すのか今一分かりかねますが、ひとつの方法としては良いと思います。 ただ、解釈には仮説が影響すること、抽象化された変数では解釈に限界があることはご承知ください。 適当なローデータをでっちあげるわけにもいきませんし、難しいですね。 ローデータからでないと判断できないものもありますので。 可能なところまで、という制限がついてきてしまうのは仕方がないのかもしれません。 また、現在即統計手法を扱える状態にはないので、回答には少々お時間をいただくことになるかもしれません。 これは実際にデータを示していただいてからの方が良いと思いますが、尺度作成においては因子分析のみならず他の分析・検定・検討が必要になる場合もあります。 やろうと思えば論文レベルにもなってしまうと思うので。 どこまでのデータを示すかはお任せしますが、即答できない可能性があることはご容赦ください。
- sironokabe
- ベストアンサー率67% (19/28)
個人的には、統計手法を理解せずに使用することは避けるべきだと思いますし、これを推奨する理由はないでしょう。 と言いますか、「**という統計手法をよく知らないのに使って良いか?」という問いかけには、大半がNOか、首をかしげることと思います。 学部生の場合、適当にでっちあげられます。 期限内に提出し、書式などを守っていれば、まず通ります。 院生(修士)の場合もほとんど通りますが、ある程度の理解はあります。 とはいえ、博士を取った研究者でも、全員が理解しているとは言えませんが。 ただ、マニュアル的に使用する方は、少数派かと思います。 統計を取ったわけでもないので、確証はありません。 勉強途中の学部生だと、結構多いとは思います。 研究途中の修士生ならば、マニュアル的に使用する方は少ないです。 ただし、ここでいうマニュアルは原理・原則を除きます。 やってはならないことをやらない、これはマニュアル通りですが、こういった類のものは除きます。 最終ユーザーとは、検査者でしょうか。受験者でしょうか。 おそらく前者のことと思われるので、それに対し回答します。 研究者は理解しています(上記)。 医師、教師などの場合、理解していない場合もあります。 これは、理解していなくても使用可能であるからです。 論点は問題ないと思います。 私自身はSASを使用していますが、SPSSを使用される方も多いです。 デフォルトと変更のどちらが多数派かですが、状況によります。 デフォルトの設定が良い場合はそのままですし、変えたい場合は変えます。 単純な数ならば、変えるほうが多いです。 デフォルトの設定は1種類ですが、その他は組み合わせも考えれば数多くあるので。 特にSASは、指定しないと因子分析すらしてくれません。 結果の参照については、一概に言えるものではないです。 前述しましたが、統計を取ったわけではないので。 また、この点におきましては多数派で括ることが困難です。 どこまでの差異をひとくくりにするかで変わってしまいます。 例えば、因子数の決め方を負荷量で判断する場合の、カットオフポイントなど。 なので、結果の解釈については、研究者による、ということになってしまいます。 基本的なことのみ述べさせていただくのであれば、固有値、負荷量、寄与率、共通性、因子間相関などに着目します。 私自身についても、一概には言えません。 上記の基本的なことに着眼しつつ、因子数、因子名、因子構造などを考察していきます。 質問者様の述べられている実務家とは、どこまでの方を指すのでしょうか。 既に標準化されたものなどは、利用の手引きがあるのでそちらを使用します。 研究途中、あるいは標準化されていないものは、研究目的以外で使用されることは少ないです。 仮に使用する場合は、尺度作成者に確認をとります。 上記は医師や教師などが使用する場合です。 研究者が使用する場合、大きく2通りあります。 尺度作成者の結果を支持する場合と支持しない場合です。 前者ならば作成者の手順に則ります。 後者ならば別の手順で行います。 どの程度支持するかで、どこまで則るかも変わりますが。 前回述べていただいた通り、車の構造を知らなくても運転はできます。 修理するには、ある程度の知識が必要になりますが。 尺度にも似たようなことが言えます。 使用するのみであれば、構造を知らずともできます。 しかし、アクセルやブレーキを知らなければ(正しく)運転できません。 つまり、何も知らないままでは(正しく)使用できません。 統計(車の構造)の知識ではなく、尺度(車の運転)の知識が必要になります。 ただ、それに異を唱えたり、さらに妥当性・信頼性のある尺度にしようと(修理しようと)するならば、統計手法の知識は必須です。
お礼
sironokabe様 下の投稿で > これは実際にデータを示していただいてからの方が良いと思いますが、尺度作成 > においては因子分析のみならず他の分析・検定・検討が必要になる場合もありま > す。 > やろうと思えば論文レベルにもなってしまうと思うので。 > どこまでのデータを示すかはお任せしますが、即答できない可能性があることは > ご容赦ください。 とご快諾いただき、ありがとうございます。 そこに追加投稿できないことに気付き、こちらに書いています。 ご快諾いただいてからデータをお渡しするのに時間がかかりすみません。 どうぞよろしくお願い申し上げます。
補足
ご回答ありがとうございます。 >デフォルトと変更のどちらが多数派かですが、状況によります。 >デフォルトの設定が良い場合はそのままですし、変えたい場合は変えます。 >基本的なことのみ述べさせていただくのであれば、固有値、負荷量、寄与率、共通性、因子間相関などに着目します。 >私自身についても、一概には言えません。 >上記の基本的なことに着眼しつつ、因子数、因子名、因子構造などを考察していきます。 一概にご回答いただくことが難しいことはよくわかります。 できる限り論点を絞りたいのですが、僕の質問がそれでもまだ抽象的だからだと思います。 また、マニュアルとか中身という言葉も、sironokabeさんとshibuyashiさんそして僕で共通ではなく微妙な差があると思います。 そのよう中か、この先できる限り論点を絞りもうすこし踏み込んだお話をうかがうのにどうしたらいいか少し考えました。 何かの論文の尺度をもとに議論すると面白いのですが、ローデータがないと限界があると思います。 また、一般論を考えるという意味でも具体的論文はふさわしくないようです。 また、具体的なデータにより教えていただくといいと思うのですが、これも具体的な変数名に引きずられた議論になってしまい一般論ではなくなってしまうので、避けたいと思います。 そこで、ひとつ考えたのは、変数名を抽象化したデータの例をご提示しますので、それをもとに教えていただくのはいかがでしょうか。 分析して尺度を作るという作成の例に基づいてお話を伺うのが、一番わかりやすいのではないかと思います。 (もちろん、お手間がかからないような簡単なデータをご提示します) いかがでしょうか。
- sironokabe
- ベストアンサー率67% (19/28)
私としては、基本的な統計についての知識は十二分に持っておられる方だと思うので、説明したら「そんなことも分かってないと思われている」と、質問者様が感じられてしまうことを避けた心づもりでした。 言葉不足であった事をお詫び申し上げます。 しかし、どの程度がら説明すべきか悩みます。 さすがに「相関とは~」から入ると、上記のように感じとられてしまうと思っています。 字数制限もあるので、なかなか難しいです。 ・偏相関、半偏相関はご存知でしょうか。 ・因子負荷は主にどこを使用するかご存知でしょうか。 ・最終的な共通性は主に何を記述するかご存知でしょうか。 上の3点についてご存知かどうかによって、変わってきます。 全て書くと、ここで書ける文字数をオーバーしそうなので。 Q5に関してですが、直交でも同じことが言えます。 直交を推される理由として、質問者様も先行研究を挙げてらっしゃいます。 現在、広く利用されている尺度とはいえ、批判が全くないわけではありません。 可能性の論議は必要ですが、収拾がつかなくなる論点でもあります。 また、質問は斜交を使用する場合なので、極力避ける、では回答としては少し甘いです。 基本的に直交であることが望ましいとお考えなのは分かりますが、ではいつなら斜交回転を使用しても良いのかが明確ではないです。 今回、確証は除外します。 広義での確証的因子分析を含めると、論点がずれる恐れがあります。 また、主成分分析も、今回は除外します。 こちらも、論点がずれると思うので。 やはり、論点は絞った方が分かりやすいです。 また、質的変数、間隔尺度未満も除外します。 各々で、私見も異なりますし、やはり論点がずれる恐れがあります。 直交、斜交、それぞれにいくつかの回転方法があります。 ただ、すべての可能性を言及するには難しいです。 なので、比較的多く使用されるバリマックスとプロマックスに限定します。 Q6について。 細かな状況設定は少し難しいです。 1つの要素が加わるだけで、変わる可能性もあります。 ちなみに、例として挙げていただいた 「ある領域に関して、先行研究で2つの因子の存在が指摘されているので、夫々に6問ずつ合計12問の質問調査を300サンプルにすでに実施したデータがある」 ですが、「ある領域に関して、先行研究で2つの因子の存在が指摘されているので、夫々に6問ずつ合計12問の質問調査」この時点で誤りの可能性があります。 あくまで可能性ですし、改善も可能ですが。 分析結果を鵜呑みにすることは非常に危険です。 「ある心理特性についての先行研究」 「先行研究などをもとにして作成された心理特性についての尺度」 「尺度を使用して得られたローデータ」 *尺度の信頼性や妥当性の検討は割愛します。 (1)仮説あり (a)因子間相関あり 斜交が望ましい。 直交の後に相関を算出するだけでは、情報量不足であるため。 相関などを算出しない場合、仮説検証が不可能であるため。 (b)因子間相関なし 直交が望ましい。 斜交では余分な情報が含まれるため。 因子の弁別は他の方法で検討することが望ましいため。 (2)仮説なし この場合は難しいです。 ただ、プロマックスが直交性を保持しているため、どちらかといえば望ましいです。 しかし無論、研究者が仮説を持っていなくともほぼ確実な直交が認められている場合などは直交が望ましいです。 プロマックス回転は、バリマックス回転の後にプロクラステス回転を行っています。 また、この方法は直交性を持たせ結果の解釈を容易にするものです。 結果の解釈については、直行よりも斜交の方が困難です。 ただ、因子分析が分析であり検討ではない以上、それは直交にも言えます。 私自身、仮説がない場合でも直交回転を使用することに異はありません。 上記の理由以外でも同じです。 それは立場の違いでしょうし、だからこそこうして議論が行えるのですから、非常に有意義だと思います。 ただ、斜交を使用しているからといって、それ自体を否定することは、少々受け入れがたいのです。 心理学の領域において、斜交回転が望ましいというのは、一部分の事実です。 尺度の利用可能性と、回転方法とが直結するわけではないので。 因子間相関があった場合、もしくはあるものと仮定した場合。 あるいはその逆。 この2つの尺度ですが、前者は総得点の算出が可能ですが後者は不可能です。 直交回転を行う場合、後者であることが多いです。 あくまでも論点を絞っての議論なので、ほかの要素により変わります。 尺度の中身や目的により、回転方法も異なります。 因子分析について研究されている方からみれば、数多くの異論もあることと思います。 私としては、尺度の中身、目的などにより、双方の回転を扱えることが望ましいと考えます。 自身がどちらの回転を優位に捉えているにせよ、他者の論文が読めなくては批判もできません。 また、どちらかの回転しか行わないと、反証可能性を失います。 繰り返しになりますが、私としては「斜交の不合理性」についてのみ異を唱えます。
お礼
なお、以下の点は、以上を限定頂いた後でお話したほうがいいかと思っています。 Q11【実務家ユーザーによる尺度の利用手順の詳細】
補足
丁寧なご回答を頂きありがとうございます。 お陰様で論点がすっきりしましたね。 >「斜交の不合理性」についてのみ異を唱えます。 と仰っておいでですので、直交については議論をとりあえず省略してもいいかと思いますので、ご提示いただいた内容で、sironokabeさんが「斜交が望ましい」とされている場合について「場合・手法・手順・理由」の想定を次のように整理してみました。 「議論の前提となる両者の共通理解」を追加し、「手順」と「理由」は纏めました。 【議論の前提となる事柄】(以下は両者とも知っていることを前提に議論) ・偏相関、半偏相関 ・因子負荷は主にどこを使用するか ・最終的な共通性は主に何を記述するか (いちいち確認していると面倒なので、今後は、sironokabeさんと僕は、因子分析に関連する数式やアルゴリズム、および関連する微分・線形代数・確率論・最適化などについて、普通のことは理解していることを前提にしても結構です。) 【手法】 確証は除外 主成分分析も除外 質的変数、間隔尺度未満も除外 比較的多く使用される(バリマックスと)プロマックスに限定 【場合】 「ある心理特性についての先行研究」 「先行研究などをもとにして作成された心理特性についての尺度」 「尺度を使用して得られたローデータ」 ただし、先行研究や仮説に誤りの可能性あり でかつ (1)仮説ありで(a)因子間相関ありの場合 または (2)仮説なし の場合 【手順と理由】 (1)仮説ありで(a)因子間相関ありの場合(sironokabeさんの仰ることは、「仮説において因子間相関がある」ということでよろしいでしょうか?) 手順:斜交が望ましい。 理由:因子間相関を斜交で表現するため(sironokabeさんの仰ることは、こういうということでよろしいでしょうか?) (2)仮説なしの場合 手順:斜交が望ましい。 理由:(sironokabeさんのお考えでは)プロマックスが直交性を保持しているため とりあえず、以上のような整理でよろしいでしょうか? また、上記の是非を考えるために、さらにsironokabeさんの語想定について、4つほどお伺いしたい点があります。 これは、以前申し上げた「状況」と関係します。 Q07【尺度作成者】 上記の「議論の前提となる事柄」を尺度作成者の多数派(仮に半分以上の人としましょう)が理解していると考えられるかどうかを、限定していただけないでしょうか。言葉を変えれば、「多変量解析の中身を理解せずに統計パッケージをマニュアル・デフォルト通りに使う作成者」(以下、マニュアル作成者と呼びます)が多数派かどうかということです。教えてgooの他のスレッドは、それを考える上で参考になるかと思います。尺度作成者を、学部4年生以上とするか、大学院院生(前期課程在籍者)以上とするかはお任せします。 Q08【尺度の最終ユーザ】 上記の「議論の前提となる事柄」を尺度の最終ユーザ(実務家を含むものとします)の多数派(仮に半分以上の人としましょう)が理解しているとお考かどうかを、限定していただけないでしょうか。 Q09【議論の方法】 今後の議論は、上記のような尺度の作成と利用の状況を踏まえて具体例を想定して話し合うといいと思いますが、それでよろしいでしょうか? もちろんプロマックス回転のアルゴリズムそのものの妥当性を話し合うのでも結構ですが、今までそれについては何度か書き込みをしたのですが特にご返答がありませんでしたし、掲示板だと行列やベクトルをきれいにかけないですし、そもそも「合理的かどうか」は利用状況に依存すると思いますので、まずはこちらを話し合ってはどうかと思います。 Q10【尺度の作成手順の詳細】 上記のような尺度作成者の多数派は、プロマックス回転のソフトウェアを自分で開発するのではなく、統計パッケージを利用すると思います。 その際、マニュアル作成者ならソフトウェアのデフォルトの設定を利用するでしょうし、そうでないなら必要により適宜パラメータを調整するでしょうが、多数派はどちらでしょうか。 もちろん、マニュアル作成者もプロマックス回転という指定はできるものとします(笑) また、プロマックス回転を行った後で、尺度作成者の多数派は、最終的にはどのようにその結果を参照してどのように尺度を作成するのでしょうか? ちなみに、上記のように「手法」を制限したので、その後確証を行うことは無いことになると思います。 (sironokabeさんにとって、Q10あまりにも初歩的な質問で恐縮なのですが、これはsironokabeさんについてではなく、尺度作成者の多数派について伺いたいのです。 上記のように「合理的かどうか」は利用状況に依存するとの考えからですので、ご寛恕下さい。 勿論、sironokabeさんならこうするというのも書き加えていただければ、なおありがたいです。)
- sironokabe
- ベストアンサー率67% (19/28)
確かに議論が拡散していますね。 収拾がつかなくなりそうなので、論点は絞っていきましょう。 Q1 その解釈は、疑似相関です。 上位概念と下位概念が相関するから上位概念が相関する、またはその逆は、あり得ません。 階層構造を成すことと相関は意味合いが異なります。 階層構造の発見においては、斜交回転の方が有効です。 これは回転の意味を知っていれば当たり前のことです。 Q2 指摘した疑似相関は、上位概念と下位概念が相関するから上位概念が相関する、という点です。 また、因子分析の手法を知っていれば疑似相関の排除の方法もご存知かと思います。 説明するまでもない、大学1年生の統計レベルです。 Q3 ネット上にあるのかは分かりません。 学術論文を読んでいれば自然と分かることです。 分からないのであれば、知識不足でしょう。 具体例なしに図のみを載せることは少し難しいです。 勝手に引用もできないので。 最低100くらいの心理学論文を読むことをお勧めします。 Q4 因子分析の回転方法、をいくつご存知でしょうか。 線形モデルに固執してしまうと、斜交回転が不合理に思えてしまうのだと思います。 さて。 一切合切の情報なしに、因子分析の回転方法について議論することはナンセンスです。 それは、情報なしに因子数を議論することと同じです。 ある程度の指標は言えますが、直交と斜交、それぞれ必要に応じて使い分けることが求められます。 なので、仮説がどうあれどちらかが良い、どちらでもよい、という結論にはなり得ません。 また、直交を推されているようですが、直交のどの回転でしょうか。 バリマックスでしょうか。 先行研究においてバリマックスを使用しているものの、仮説を確認していますか。 斜交回転は不合理だから使用しない方が良い、とお考えのわけではないのですよね。 では、どのような場合に斜交回転を使用した方がよいとお考えなのか、お聞かせ願います。 どの点において、意見の相違があるのか、確認しておきたいので。
お礼
順番が狂っているのですが、2009/09/28にこのお礼を書いています。 といいますのも、いままでsironokabeさんにデータをお渡しすべく様々に努力したのですが、直接のやり取りを禁止しているこのサイトの方針のためか、メールがとどかなかったり、このサイトの管理者の方からチェックが入る(自動的にチェックする機能があるようで、下に投稿した内容も修正されて、意味不明の文章にされてしまいました)などして、うまくいきませんでした。 そのため、一番下の投稿で > これは実際にデータを示していただいてからの方が良いと思いますが、尺度作成 > においては因子分析のみならず他の分析・検定・検討が必要になる場合もありま > す。 とご快諾をいただいてからすっかり時間が経ってしまいました。 そこで、自分のところに載せることにしました。 http://blog.goo.ne.jp/crossharuに合計300サンプルのデータを載せましたので、ご覧いただけないでしょうか。 大変不便で申し訳ないのですが、ここのブログの仕様でファイルを載せられないので、文字数制限の関係で複数記事にわかれていますので、1つのcsvにしてご利用ください。 18変数(抽象的な変数名にしました)で300サンプルとなります。 尺度作成における統計ソフトの利用状況を踏まえた斜交回転の合理性・非合理性を考えるという今までの議論の流れから、これはsironokabeさんの回転の仕方を見せていただくという以上に、尺度作成者の多数派(仮に半分以上の人としましょう)がどのような理解からどのように回転を行うかを検討するための例題です。 したがいまして、もしsironokabeさんと尺度作成者の多数派(多数派は錯誤をするかもしれません)とで進め方が違うようでしたら、両方の進め方をお示しいただいてもありがたいです。 どうぞよろしくお願い申し上げます。
補足
sironokabeさんは、僕のことを「説明するまでもない大学1年生の統計レベルも知らないような、知識不足の人物」とお考えのようですね(笑)。 実は、僕もsironokabeさんが「探索的因子分析と確証的因子分析の違いを理解していないのではないのか、またそれらの数式やアルゴリズムを理解していないのではないか、尺度の議論とモデルの議論を混同しているのではないか」(以下、「仮定」とします)と考えていたのですが、今回のお答えは(下に書くような理由で)答えになっていなかったので、その印象がまた強くなりました。 そのため、僕からもどうお返事していいか困っています。 しかし、異分野の方と話しコミュニケーションがうまくいかない時に、それが異分野のせいであるためか、相手の一般的な知識レベルが低いためか、分からなくなることはあると思います。 いいコミュニケーションをするには、どちらの可能性もあるということを留保して、お互いに相手を思いやりながら、相手のいい点を見て話し合うことが大切だと思います。 そこで今後は、上記の「仮定」のもとに、議論をするのがいいのではないかと思うようになりました。 sironokabeさんも僕を「説明するまでもない大学1年生の統計レベルも知らないような、知識不足の人物」と仮定して、そういう人が分かるように「説明するまでもない」ことも分かりやすく回答をしてくださると、また質問に質問を返すことや単なる手法の名称の紹介はやめてご自分の結論を理由とともに書いていただけると、ありがたいです。 sironokabeさんからのご質問に新しい番号を振って見ます。 Q05:どのような場合に斜交回転を使用してよいのか sironokabeさんとのやり取りを振り返ると、実は「仮定」は「多変量解析の中身をまったく理解できないのにマニュアル的に使う」という状況とは関係があり、日本の心理学などの人文科学一般の状況である可能性があると気づきました。(以下それを「状況」と呼ぶことにします。) 「状況」を考慮すると(当初はそこまで考慮していませんでしたが)、斜交尺度がユーザーをミスリードする以前に、尺度の開発者自身がミスリードされている恐れがあり、大いに心配だと思います。 迷子が迷子(間違った先行研究)に道案内をしてもらえば、二人とも迷子になる(後続研究も間違った結果を導く)でしょう。 先行研究の有無にかかわらず、ちゃんと分かっていない人が斜交回転をすると、迷子になってしまう可能性もあると思います。 「状況」を考慮すると、仮説が斜交だといって斜交回転をすれば、単なる「自己成就」になってしまう恐れが大きいと思います。 Q05の答えに当たることはすでに前前回に書いています。しかし、今回は上記の「状況」を考慮して、以下のように追加修正させてください。(上記「仮定」から、探索的な斜交回転に限定し、確証的な方法でモデルを作る場合の議論は捨象します。) 少なくとも人文科学での尺度作成に関する限り、探索的な斜交回転は極力避けるべき。 なお、「仮定」のもとでは、 >一切合切の情報なしに、因子分析の回転方法について議論することはナンセンスです。 というのはよく理解できます。 そこで次の僕のほうから、Q05を発展させて質問させてください。 Q06:sironokabeさんは、どのような場合に、どのような斜交回転手法を、どのような手順で、どのような理由で行ないますか? 「教えてgoo」という性格上、回答者様の「教えて」下さる事が指針として役に立つことが大切です. 質問に質問を返さないで、sironokabeさんのお考えの場合を任意に設定して、具体的な手順とその理由を説明していただけないでしょうか。 sironokabeさんがそうなさりたいなら、確証的な方法についもて言及いただいて結構です。 どのような場合・手法・手順・理由を考えるかはおまかせします。 例えば、「ある領域に関して、先行研究で2つの因子の存在が指摘されているので、夫々に6問ずつ合計12問の質問調査を300サンプルにすでに実施したデータがある」などの、任意の場合をご自由に決めてください。 ベテランのドライバーは力学や設計について全く何も知らなくても上手に運転できるでしょうし、「こういう場合はこういう手順で運転する、なぜならばこういう理由だ」と説明もできるでしょう。 sironokabeさんがそういう風に進めていらっしゃるならそれを尊重したいですし、「場合・手法・手順・理由」にフォーカスすれば、上記の「仮定」と「状況」のもとでも建設的に「教えて」頂くことが可能だと思います。 僕のほうでは、sironokabeさんに歩調を合わせたいと思います。
- sironokabe
- ベストアンサー率67% (19/28)
マニュアル通りにやるのは、論外ですよね。 そういった風潮があることは、良いことであるとは思えません。 ただ、マニュアルの全てを批判することもまた、良いことではないのでしょう。 手計算で行われた分析の論文は、中身がよくても評価は低いでしょう。 ちなみに、村上先生は「上位概念がいくつかの下位概念を共有(と相関)する結果、上位概念が相関する」ことは述べていないかと思われます。 というより、それは疑似相関です。 直交か、斜交か。 難しい判断ですね。 可能な範囲内で、質問者様が作成なさっている尺度が何を測定しているのか教えていただけないでしょうか。 BIGFIVEも、最初から直交だ!として決めつけていたら、生まれなかった尺度であり、概念です。 しかしながら、斜交に固執していても、生まれなかったでしょう。 つまり、直交万歳では、まともな博士論文はかけませんし、その逆もまた然りです。 いずれにしても、不合理性を説くのは、現時点では意義の薄いものでしょう。 ただ、注意していただきたいのは、もし質問者様の作成なさっている尺度の測定するものが、先行研究において関連性のある構造が認められているかどうかです。 認められている場合は、斜交で行うべきですし、その逆ならば直交で行うべきです。 もし違う回転を行うのであれば、根拠を示してから行わなくてはなりません。 心理学において多変量解析が好まれるのは、単純さや無色透明さが汎用性につながるからではありません。 むしろ複雑化され、有色であり不透明になるからです。 私が述べたいのは、斜交回転は不合理ではない、ということです。 何でもかんでも直交にすべき、という意見は賛同しかねます。 少なくとも、汎用性のある理論の多くは斜交回転から出発しています。 理論の自己矛盾性は不完全性定理がある以上は必然でしょう。 そもそも、直交モデルや斜交モデルの”図”はご覧になったことがあるでしょうか。 線形モデルに限らないことはご存知でしょうか。 直交回転と斜交回転は、それぞれ目的と意味が異なります。 前にも述べましたが、仮説が関わってくることは否めません。 仮説にはそれなりの根拠が必要となります。 因子間相関がない、という仮説を立てることが可能であれば、何ら問題はないと思います。 今回は回転についての話なので無視してきましたが、因子負荷の推定も重要であることは念頭に入れた方が良いと思います。 仮説を無視して回転を決めることは望ましくないと思われます。 どちらかの回転に依存していては発展を望めません。 研究者ごとに見ても、論文によって回転方法が異なることはよくあることです。
補足
前に僕が書いたことは長すぎたようです。 たくさんのことを議論していると拡散してしまうようですね。 今後は、ポイントを絞って質問をさせてください。 質問部分にはQ番号を振っておきましたので、それを使っていただけるとありがたいです。 >マニュアル通りにやるのは、論外ですよね。 >そういった風潮があることは、良いことであるとは思えません。 >ただ、マニュアルの全てを批判することもまた、良いことではないのでしょう。 >手計算で行われた分析の論文は、中身がよくても評価は低いでしょう。 中身を理解しないで使い方だけ覚えることをマニュアル統計学と呼んでいます。 手計算は関係ありません。 >「上位概念がいくつかの下位概念を共有(と相関)する結果、上位概念が相関する」ことは述べていないかと思われます。 村上さんの以下の部分は読み方を逆にして「下位位概念がある上位概念を共有(と相関)する結果、下位概念が相関する」と解釈することもできます。 その場合でも、僕の言ったことは上位下位を逆にすれば変わりありません。 Q01 それ以外の解釈があるならお教えいただけないでしょうか? >通常,質問項目はデタラメに集められているのではなく,何か1つの上位概念にカバーされると想定されるような範囲(自己意識,親和動機,自己不全感)で収集されるから,「因子分析」の結果として,それらがいくつかの下位概念(公的自己意識,私的自己意識)等からなるという,一種の階層構造をなすことが発見されることはよくある。この点で,回転は直交回転より斜交回転が望ましいであろう。 >ちなみに、村上先生は「上位概念がいくつかの下位概念を共有(と相関)する結果、上位概念が相関する」ことは述べていないかと思われます。 というより、それは疑似相関です。 ここで擬似相関での議論をするのは無関係なことに感じました。 上記のように読み方を逆にしても同じです。 探索も確証も因子分析のアルゴリズム自体は擬似相関を排除しないからです。 Q02 もし人間の運用ではなくアルゴリズムによって因子分析における擬似相関を排除できるなら、そのアルゴリズムの説明をしていただけませんか。 >そもそも、直交モデルや斜交モデルの”図”はご覧になったことがあるでしょうか。 Q03 その図をアップするか、URLを示すかして説明していただけませんか。 この掲示板はプレーンテキストベースのため、図が書けないし、行列・ベクトル・要素などを書くこともできないので、せめて図がないとおっしゃる意味が分かりません。 >線形モデルに限らないことはご存知でしょうか。 Q04 これも線形モデルでない因子の回転を説明していただけませんか。 (変数分布の線形変換のようなモデルと関係ない単純なものは対象外としてください。回転などの最適化過程なども当然対象外です。) >可能な範囲内で、質問者様が作成なさっている尺度が何を測定しているのか教えていただけないでしょうか。 具体例ではなく、なるべく数式やアルゴリズムに沿って話をしませんか。 一般論を話しているときに、具体例に基づくと恣意的な議論になったり、具体例に引きずられて議論が拡散する恐れがあります。 >もし質問者様の作成なさっている尺度の測定するものが、先行研究において関連性のある構造が認められているかどうかです。 >認められている場合は、斜交で行うべきですし、その逆ならば直交で行うべきです。 >もし違う回転を行うのであれば、根拠を示してから行わなくてはなりません。 >仮説を無視して回転を決めることは望ましくないと思われます。 ちょっと前の先行研究はたいていはバリマックスですが、仮に先行研究が斜交回転をしていても、また仮説がどうであれ、直交回転をして悪い理由はありませんし、したほうがいい理由もあります。 その理由はたくさんあり、探索と確証に分けてアルゴリズムに沿って箇条書きで説明することができます。 もちろん、僕も直交以外するべきでないというわけではないので、斜交回転がどういう場合に合理的かどうかの議論と交えて行うこともできるでしょう。 ただ順番としては、論点が拡散しないように、まず上記は上記Q01からQ04について教えていただいてからお願いできないでしょうか。 どうぞよろしくお願いします。
- sironokabe
- ベストアンサー率67% (19/28)
私としては、直交回転を批判はしませんし、使用することにも問題はないと思います。 これは以前に回答したとおりです。 ただ、勘違いしたまま使用することは避けるべきとは考えます。 回答者同士の議論はあまり好まないのですが、せっかくなのでshibuyashi様にご指摘いただいた中身の話をしたいと思います。 一応、ここでは、探索的因子分析とします。確証的のほうは、いろいろ厄介なので。 また、shibuyashi様が張られているリンク先の、村上先生の意見にあります主成分分析については、現在の議論(「因子分析」の回転方法)から大きく外れるものと考えられますので、因子分析を行うなら、という前提で進めます。 幸福感について尺度を作るとしましょう。 ここでは、幸福感を感じる時、と定義します。 尺度項目を収集・作成します。 おそらく、「お菓子を食べた時」という項目は妥当ですが、「お菓子が好きである」という項目は妥当ではないでしょう。 また、「衣服を選ぶ時は金額を重視する」という的外れなものは論外だと思われます。 一定の方向性を持って集められた項目。 さて、この尺度の総得点を持って、幸福感としてよいのでしょうか。 幸福感とはいっても、色々あるのかもしれません。 そこで、1つの方法である因子分析を行います。 斜交回転は、回転時に軸の角度を調整可能なため、最も理解しやすい回転を行い、因子間の構造を明らかにします。 直交回転は、回転時に軸の角度を直角で固定するため、固定的な回転を行い、各因子に焦点を当てることになります。 さて、斜交回転か直交回転か。 ちなみに、この段階・この情報量だけでは、確定的な回答は出せません。 ただ、一般的に。 心理学で扱うものに関しては、その構造を明らかにした方が良いと思われます。 もし、因子が独立である(弁別可能である)ならば、総合的な指標である必要がないからです。 そして、因子が関連し合うならば、総合的な指標として位置付けられるからです。 例えばBIGFIVEについて、1つの因子を抜き出し、その指標とすることは可能です(尺度としては別問題)。 理論基盤がない状態ならば、なおさらのことと考えられます。 質問者様がどの程度の理論基盤から尺度を構成されているのかにもよります。 また、1つの大きなまとまり(総合的)な尺度なのか。 いくつかの指標の集合体である尺度なのか。 それによると思います。
お礼
PS1 より広い文脈とは、何のための心理学かということです。 たとえば、医学のように利用場面とその社会的効用が完全に明確な分野なら、疾病に関する因果モデルとその疾病を診断するための尺度が一体で複数指標間(または因子間)に相関ありでも、その作成においてもその利用においてもなんら問題は無いし、むしろ社会的価値あることでしょう。 緑病の因果モデルと尺度が明確になれば、緑病で苦しむ人を救う上で有益であり大きな社会的価値があるし、それが赤病の人に使えなくてもなんら問題ありません。 特定の経済政策に利用するための経済尺度・経済モデルについても同様でしょう。 しかし、心理学のようにそもそも何の役に立つのかが(自然科学はもとより他の社会科学よりも)はっきりしない印象の学問で、そういうことをしていていいのでしょうか? まずはなるべく社会で使ってもらうことを考えたほうが良いのではないでしょうか。 その努力なしに日経新聞や実務家を非難にするのは本末転倒だと思います。 大学院生がちゃんとドクター論文を書け、研究の社会的価値(利用可能性)が高めるためには、心理学の常識を変えたほうが良いかもしれません。 ただ、それが難しいだろうことも想像できます。 門外漢が勝手なことを言いましたご無礼は、あらかじめお詫びします(汗)。 PS2 こういう議論を楽しくできるのが、ネットの素晴らしいところだと思います。 リアルの世界では先生方をさん付けで呼ぶことも無いでしょうが、とらわれずに議論できて、そういうなかで自分なりの気づきがあります。(上記の常識の違いなど) ちなみに、リアルの場合は、自分の指導教官が結論ありきの信念をお持ちなら、日本の院生や研究生の立場だと「先生、ご無理ごもっとです」と従うしかないんですよね。 日本では、そういうことはどこの分野でもあるのだと思います。 それは友人も僕も尊重するしかないんです。 別の文系の友人は、日本にいるときは多変量解析の中身をまったく理解できなかった(のにマニュアル的に使っていた)けど、アメリカに留学して初めて分かるようになったといっていました。 それまでは指導教官の言うとおりにマニュアル的にやっていたそうです(笑)。
補足
shibuyashiさん、sironokabeさん、ありがとうございました。 村上さんの文書も興味深く拝読しました。ここでまとめてご返事します。 shibuyashiさんのいう中身の議論は賛成です。 推定法や回転法などの手法の単なる名称の紹介ではなく、数式・アルゴリズム・それらの効果などの中身がないと趣旨不明確になるからです。 僕はなるべくそういう質問をして、sironokabeさんには中身に沿って背後にある意図をご説明いただけようにもお願いしました。 ただ、あまり前進が無いような気がしたので、議論をストップしていました(笑)。 今回のsironokabeさんのご回答で、少なくとも意図はかなり分かりました(感謝です)。 >心理学で扱うものに関しては、その構造を明らかにした方が良いと思われます。 >もし、因子が独立である(弁別可能である)ならば、総合的な指標である必要がないからです。 >そして、因子が関連し合うならば、総合的な指標として位置付けられるからです。 ここで構造とはモデル(説明モデルや因果モデル)と言い換えて良いでしょう。 これを拝見して、心理学の意図は、「尺度とモデルを区分し、両者の利用場面やユーザーを区分して考え、そうすることで広い利用可能性を確保する」という世間の常識とは違う独特のものなのだろうと感じました。 そうなら、心理学では尺度作成=モデル作成で尺度利用=モデル利用となり、モデルの仮説が想定している相関関係が尺度(sironokabeさんのいう、総合的尺度)に含まれているのは、むしろ当然ということになります。 だから世間的な発想は、心理学になじまず「誤解」と言われるのでしょう。 しかし、一般的な科学ではより広い利用場面やユーザーを想定するので、尺度への意図が心理学とは違い(sironokabeさんのいう、いくつかの指標の集合体である尺度)、直交回転(あるいは主成分分析)を使うことが多いのでしょう。 以上が心を扱う心理学の宿命なのなら、問題無い(仕方ないし、批判すべきでない)でしょう。 問題は、backsさんやshibuyashiさんがご指摘される「意図と中身を理解せずマニュアル的に使用する風潮」があるのなら、それではないでしょうか。 例えば、sironokabeさんのご主張から言えば、斜交の探索で尺度をつくるよりは、確証的方法で尺度作成=モデル作成を一体で進める(比重はモデル作成)のが自然なはずです。 しかし、マニュアル的使用で確証的方法を使えば、今度は村上さんのいう「共分散構造分析・潜在方程式モデルが,心理学の分野において,研究の発展を促進するというよりも,むしろ妨げているのではないかという懸念」がもたげます。 村上さんが >一種の階層構造をなすことが発見されることはよくある。この点で,回転は直交回転より斜交回転が望ましいであろう。 と言っているのは >いつまでたっても分析が終わらず,一向に論文が書けない大学院生も散見される。 と書いているように、中身が分からずマニュアル的にSEMを利用して泥沼にはまるくらいならば、まだしも探索的な斜交回転のほうがましということのようです。 もっとも、その前に村上さんは >項目間には,単なる誤差とは言えず,かつ簡単にはモデル化できない共変関係が存在している から >モデルのあてはまりは悪くても,一定の内的整合性をもてば,測定尺度としては成立しうることを認めるべきである。 と書いていますから、それならば(どうせモデル化できない共変関係を無視するなら)、直交回転をベースに無相関を想定した指標郡(尺度)を用意したほうが、利用可能性が広くて良いと思います。 村上さんのいうことは、「上位概念がいくつかの下位概念を共有(と相関)する結果、上位概念が相関する」ということでしょうから、その点からしても、尺度としては下位因子の層のみ直交するように用意して、上位因子は尺度よりはモデルで反映するべきではないでしょうか。 もっと精度を高めるような数学的方法はいくらでもあるのに多変量解析が広く使われているのは、その単純さや無色透明さが汎用性につながるからです。 前にも書いたけど、非線形な世界を無理やり線形的なモデルで説明するのだから、細かなことを気にしても仕方が無いのに斜交で尺度を求めることは、ある意味自己矛盾ではないでしょうか。 以上書いたことは、心理学の常識とは違う考えなのでしょうね。 さりながら、より広い文脈でいえば、「心を扱う心理学では尺度作成=モデル作成で尺度利用=モデル利用なのは宿命だ」という心理学の常識自体が正しいかも、検討の余地はあるとは思います。
- shibuyashi
- ベストアンサー率0% (0/0)
このスレッド面白いと思ったのですが、もう終わっちゃってるのでしょうか。続きを読みたいです。 なんか、議論がすれ違ってるみたいですね。crossharuさんが中身について質問して、backsさんが答えてくれてますが再質問で終わっていますし、sironokabeさんの最後の答はこうすることになっているみたいな内容ですね。弟子を叱る昔の職人さんや板前さんの話しみたいで理由が分からないし、crossharuさんも叱られた弟子みたいに黙っていますね。 crossharuさんが簡単な説明過ぎると理解がかえって難しいというのは、そうだと思います。backsさんは心理学者であっても統計に関して全く無知な人がいて変なことを言うと書いてますけど、数学が苦手でもわかるとか図で分かるとかいうマニュアル的な心理統計の本がたくさん出ていることを考えると、心理学では使い方の話中心になるのだと思います。でも、統計の使い方だけではなく中身の議論をしないと、使い方の意味が見えてこないと思います。 sironokabeさんも中身の話をしてくれたら面白いのではないでしょうか。そうでないと、話がすれ違ってしまうと思います。 心理学の世界にも、中身を踏まえながら意味のある使い方について柔軟な話をする人はいます。crossharuさんの質問や、尺度を作りたいという目的からすると、参考URLにのせた村上隆先生の説明も役に立つと思います。この資料の目的は心理学者によるマニュアル統計的風潮を批判することにあるようですが、そこに次のように書いています。 質問項目はデタラメに集められているのではなく,何か1つの上位概念にカバーされると想定されるような範囲(自己意識,親和動機,自己不全感)で収集されるから,「因子分析」の結果として,それらがいくつかの下位概念(公的自己意識,私的自己意識)等からなるという,一種の階層構造をなすことが発見されることはよくある。この点で,回転は直交回転より斜交回転が望ましいであろう。 crossharuさんが上位概念のレベルの尺度を作りたいのか、下位概念のレベルの尺度を作りたいのかで話は変わってくると言えます。こういう中身に基づいた話をしたほうが、何よりもまず仮説が重要という雲をつかむような話よりもずっと分かりやすい思います。
- sironokabe
- ベストアンサー率67% (19/28)
尺度の利用可能性として、因子間の独立性が認められるべきかという点については、議論を要します。 それは、何の尺度であるのかに依存しますし、使用目的にも依存します。 しかし、そのことと因子分析の回転方法とは何ら関係はありません。 やはり、因子分析についてのご理解が浅いことと推察します。 「直交回転を行ったから因子は独立している」とは言えません。 言えるとお考えなら、因子分析を根本的に誤解なさっています。 因子分析のモデルの是非については、議論の余地を残すところかと思います。 しかし、尺度の利用可能性を広めたいから直交回転を行う、では説明がつきませんし、認められません。 もしその理由で直交回転を行った場合、全く使えない尺度としてみなされ、学術的価値はなくなります。 心理学についての知識は深くないものと推察しますが、少なくとも心理学上は無価値です。 論拠とされている、現在広く利用されている尺度の研究論文はお読みになりましたでしょうか。 因子分析についての知識は十分でしょうか(すべての初期値の推定法、すべての回転モデル、因子構造、偏相関、他)。 尺度集だけ読んで理解した気担っても意味がありませんし、あれだけで理解できるものではないのです。 直交回転=独立 とお考えの時点で、議論以前の問題です。
- sironokabe
- ベストアンサー率67% (19/28)
中々に面白い意見ですね。 現在、直交よりも斜交が主流であることは事実なのです。 といいますのも、昔は現在ほど統計ソフトが充実していませんでした。 そのため、計算が容易である直交回転が主流となっていました。 しかし現在、統計ソフトで容易に斜交回転が可能となっています。 そのため、以前はやりたくてもできなかった研究も可能となりました。 斜交回転は、直交回転よりも情報量が多いことはご存知かと思います。 そのため、様々な視点からの解釈が可能であり、反論を受けにくいということがあります。 そもそも、因子間の独立性を仮定しない、ということがあります。 関係し合うことを前提としているのに、直交回転を行うことが不適切であることはご理解いただけると思います。 さて、質問者様の仰る汎用性の高い尺度の作成は容易ではありません。 各因子間が独立していることを、証明しなくてはならないのです。 その過程において、斜交モデルを採用することは必要となります。 無論、他の方法でも検討可能ですが、いきなり直交回転を行うことは妥当性を欠きます。 たとえば、先行研究から、独立した因子構造であることが想定されるのであれば、最初から直交回転でも問題ありません。 ご友人様が述べられている風潮についてですが、それは当たり前のように思えます。 様々なモデルで解釈可能なものにしたいなら、斜交回転でなくてはなりません。 なぜなら、直交回転は斜交回転を行わないため、斜交モデルでの解釈が不可能であること。 斜交回転におけるプロマックス回転は、バリマックス回転の後にプロクラステス回転を行うため、直交モデルと斜交モデルの双方を内包しており、直交モデルと斜交モデルの双方からの解釈が可能であること。 以上のようなことから、特定モデルによらないのであればなおさらのこと斜交回転が望ましいと考えられます。 広く使われている尺度の中で、比較的古いものに関しては直交が多く見受けられることと思います。 比較的近年の者に関しては、斜交回転が多く見受けられることと思います。 心理測定尺度集ですが、あれだけではダメです。 原著を読まなければ、使用することは望ましくなく、また理解も不可能であると思います。 質問者様は、因子間相関のない尺度を作成されたいのでしょうか。 もしそうなら、回転の方法を議論する以前の段階です。 直交回転をおこなったからといって因子相関がなくなるわけではないのです。 直交回転を行ったら、結局各因子間の相関を求めることになります。 斜交回転で因子間相関が認められなければ、各因子が独立していることの一指標となります。 なので、直交回転なら独立、ということではないことはご理解ください。 基本的に、直交回転を行うときは各因子構造が独立していることが想定されるときが主です。 広く使われている尺度は、斜交回転を行うなどの経過を経たうえで、独立性が認められ、直交回転で解釈しています。 BIGFIVEも、もともとは倍以上の因子数のものを、斜交回転などで相関の高いものをまとめています。 勝手に独立しているということはできないのです。 いずれにせよ、独立した因子構造を目指すのであれば、因子間相関の算出は必須です。 直交にしろ斜交にしろ、結局は分析であり検定ではありません。 解釈の問題であり、結果は研究者にゆだねられます。 SMC法やMAX法などの推定法がさして問われないのは、解釈に直接影響を与えないからです。 因子分析は、分析です。 直交=独立 斜交=非独立 ではないのです。 だから、どちらの回転方法が優位であるということはありません。 ただ、直交回転が独立した因子構造を前提としている以上、根拠をもって独立していると言えない限り、使用するのはあまり望ましくないのです。
補足
>といいますのも、昔は現在ほど統計ソフトが充実していませんでした。 >そのため、計算が容易である直交回転が主流となっていました。 斜交回転も計算は容易だと思います。 むしろ、イタレーションがないのだから、計算量は少ないですよね。 心理測定尺度集はバリマックス回転が多数派のように見えますが、それらの尺度は1990年代に作成されたもので、そのころにはパソコンも十分に普及し、ずいぶん前からSPSSなどでは回転のオプションが相当数用意されていました。 >関係し合うことを前提としているのに、直交回転を行うことが不適切であることはご理解いただけると思います。 関係し合うことを前提としている特定のモデル(論文)のためだけの便宜的な分析なら、おっしゃるとおりです。 sironokabeさんは尺度の議論ではなくてモデルの議論をなさっている印象があります。 しかしさまざまな場面・モデルでの利用を望まれるなら、因子(尺度)が関係し合うことを前提としているような尺度を作ること自体が、利用可能性が低くて、不合理だということです。 >各因子間が独立していることを、証明しなくてはならないのです。 >その過程において、斜交モデルを採用することは必要となります。 >直交回転が独立した因子構造を前提としている以上、根拠をもって独立していると言えない限り、使用するのはあまり望ましくないのです。 先にも書いたのですが、たとえば、プロマックス法では、直交回転で得られた因子負荷量を「列の絶対値の最大値」で正規化しつつ何乗か(3回くらい)することで、より単純構造な因子負荷量行列を目標行列として用意するのですが、その過程で同一方向の大きな負荷量を共有する因子同士は当然に相関を持つように(大概の場合は)成長します。 そのような目標行列に近づくような回転を求めれば、因子が相関を持つのは当然です。その過程で個々の因子の寄与率も無意味なものになってしまいます。 こんな変なことをするなら、なぜ回転前の初期行列でしないのかでしょうか。 もともとの回転(直交回転)を無意味にするようなことをやるくらいなら、はじめから回転の代わりにしたほうがいいのではないでしょう。 また、またなぜ定常状態になるまでしないのでしょう。そのほうが、より単純構造になるはずです。(それでも僕は使わないでしょうが、、、、) これらの点を考えると、ずいぶんと不自然だと思います。 Sironokabeさんは、こんなアルゴリズムを合理的だとお考えですか? (そうお考えのように拝察できますが、)合理的だとお考えなのなら、その理由を教えてください。 >斜交回転は、直交回転よりも情報量が多いことはご存知かと思います。 何を持って情報量が多いとおっしゃっているのでしょうか? ランクが下がり、寄与率が狂ってしまうなど、情報量は減ると思うのですが。 >直交回転は斜交回転を行わないため、斜交モデルでの解釈が不可能であること。 をもって情報量が多いとおっしゃるなら、それは本末転倒の議論ではないのでしょうか。 >直交=独立 斜交=非独立 ではないのです。 これは、因子がもともと存在しかつ知られている(強い仮定がある)ことを前提にした議論ですが、そうであるあるならばそもそも探索的因子分析をする必然性がないことになってしまいます。 因子が既知でないからこそコンピュータ(というかアルゴリズム)の助けを借りるわけで、そうならアルゴリズム上から直交=独立のはずです。 この点からも、sironokabeさんは尺度の議論ではなくてモデルの議論をなさっている印象があります。
- backs
- ベストアンサー率50% (410/818)
例えば: 豊田秀樹「共分散構造分析 入門編」朝倉書店 p280 から始まる説明などを参照されるとよいかもしれません。あるいは: 足立浩平「多変量データ解析法 心理・教育・社会系のための入門」ナカニシヤ出版 p112 なども参考になるでしょう。
お礼
PS1. 豊田さんの当該個所に、実質科学・実質科学的意味ということを何度も強調なさっていました。 実は、友人の心理学者も科学ということをしばしば強調します。 しかし、その他の分野のいわゆる科学者(理学・工学・薬学・医学などの自然科学や経済学・数理社会学などの社会科学の博士号をもっているような人たち)が、実質科学という言葉を使うのを聞いたことがありません。 友人の話を聞くと、今も昔も心理学には内部に「科学的でない人たち」がいて大変なのだという印象を持ちました。 豊田さんのご説も、そのような事情を踏まえた教育的指導が含まれているのだろうと、感じています。 ただ、いわゆる科学者の多数の人たちがごく自然に大切にしていることは、実質科学的意味があるかどうかではなくて(ていうか無いともともと思っていない)、自分の研究が社会で使われて役に立つかじゃないですかね。 だからなるべく「単純な構造」にしたがると思います。 (複雑なパスからなる構造方程式モデルのような)相対的に複雑な構造を作るのは単なる作業ですから簡単で、(そのより単純な特殊系である重回帰モデルのような)「単純な構造」を作るほうが、価値がある分だけ難しいものかも知れませんね。 PS2. もし、backsさんやsironokabeさんが豊田秀樹さんご本人だったらと、えらくあせってます(笑)。 万一ご無礼がありましたら、平にお許しください。
補足
ご返信ありがとうございます。 >例えば: >豊田秀樹「共分散構造分析 入門編」朝倉書店 p280 >から始まる説明などを参照されるとよいかもしれません。あるいは: >足立浩平「多変量データ解析法 心理・教育・社会系のための入門」ナカニシヤ出版 p112 >なども参考になるでしょう。 どちらも以前買って通読してその後、つんどくしてました(笑) 豊田さんや足立さんのように入門書を書かれるというお仕事は、社会の役に立つ非常に立派なお仕事だと尊敬しています。 入門書ですから、読者を想定しての教育的指導として、敢えて雑駁な書き方や決めつけをされることもあると思います。 後進を育てるためには、きっとそういうことも必要だと思います。 その上でご失礼が無いように願いつつ申し上げるならば、豊田さんのp280右側(ずいぶん細かな字の説明でした、笑)の4つのご主張のうち、1つは大賛成ですが、あとは賛成しかねます。 まず1番目の「プロマックス解のほうをバリマックス解より勧める」というご主張には、少なくとも尺度としての広い利用を考えれば、今まで書いたように賛成できません。 2番目の「『重回帰分析の際には多重共線性があるから直行がいい(ハハハ、僕の言ってたことですね)』というのは間違い」というご主張は、もともと常識的に相関が高い例をあげてなさっているので、後だしじゃんけんのようなもので、説得力がないと思います。 3番目の「重回帰分析をしたいなら相関の低い原因変数を用意すべき」というご主張は、まさに僕の言っていることで、大賛成です。さらに、そのご主張を第1と第2にあてはめれば、豊田さんの言うことは僕のいうことと結局同じです。(その解釈のもとでは、4つのうちの3つに賛成となります) 4番目の「無相関が想定される場合も斜交解を求めて本当に無相関か確かめるべき」というご主張は、3番目と整合性はあるのですが、先の投稿に書いたような理由から賛成しかねます。 ある人が自分の論文のために、斜交回転の因子を用いて、あるいは事前の仮説に基づいて、因子相関を前提にした構造方程式モデルを作って論文を書いたりするのは、あくまでもその人の土俵の中のことですから、結構なことです。 そのように、尺度を利用するモデルを自分の論文の中に限局していいなら、尺度間に相関があってもなんら困らないのです。 しかし、逆に言えば、尺度の利用をその(論文の)モデルに限局しているのですから土俵は狭くなり、利用可能性は犠牲になるわけです。 推測ですが、豊田さんがプロマックス解にこだわっているのは、単純構造にこだわっているからでしょう。 そうならば、3番目の努力をしたほうがいいのではないですかね。 「因子分析でいう単純構造」は、もっと広い文脈で言えば普通の意味で言えば「単純な構造」(いわゆるオッカムのかみそり、笑)の一種でしょう。 なぜ「単純な構造」がいいかというと、そのほうが利用可能性が高くなるからです。 そうだとするならば、利用可能性の低くなるプロマックス解にこだわるのは、本末転倒なような気がします。 ご本のp281でも寄与率のことをご説明ですが、おかしな寄与率になるような回転方法にそこまでこだわる理由がよく理解できません。 もっと、別のことに努力を注いだほうがいいような気もします。 (たとえば、豊田さんのご本では非常にベーシックなことにとどめていらっしゃる最適化方法のことなど)
- 1
- 2
お礼
>やろうと思えば論文レベルにもなってしまうと思うので。 backsさんがご紹介くださった足立さんの以下の資料(たぶん予稿論文)を見つけました。 http://ci.nii.ac.jp/naid/110001888477/ ここでは、判別測度の損失が目的関数になっていますが、このような目的関数の設定だけでいいかなどは、検討の余地もあるでしょう。 (記述的多変量解析一般のそもそも論に関係することでしょうが、、、、) そういうことは、ご快諾いただいたような利用状況に関係があるはずですので、論文レベルになるかもしれませんね。 (僕は門外漢ですので、もしそういう先行論文がすでにあれば教えてください)
補足
ご快諾いただきありがとうございます。 >回答には少々お時間をいただくことになるかもしれません。 >どこまでのデータを示すかはお任せしますが、即答できない可能性があることはご容赦ください。 はい、もちろんです。 無理なお願いをご快諾いただき、感謝いたします。 >解釈には仮説が影響すること、抽象化された変数では解釈に限界があることはご承知ください。 このあたりもできるかぎり考慮した形(領域依存の具体的な仮説には影響されない形)でご提示したいと思います。 しばらくお時間をください。 どうぞよろしくお願い申し上げます。