• 締切済み

重回帰分析の多重共線せんいついて

重回帰を行います。説明変数間に相関がないか確認するために、ピアソンの相関係数を確認します。名義尺度をダミー変数化し、連続変数として扱う場合、他の説明変数間との相関は、ピアソンの相関係数を参考にすべきか、その検定のp値を参考にすべきかわかりません。ご指導ください。

みんなの回答

  • backs
  • ベストアンサー率50% (410/818)
回答No.1

> 他の説明変数間との相関は、ピアソンの相関係数を参考にすべきか、その検定のp値を参考にすべきかわかりません。 あくまで相関があるかどうかは「相関係数の値そのもの」を参考にします。母相関係数が0であるという帰無仮説はサンプルサイズを大きくすれば棄却されるようになります(つまりp値が小さくなる)。だから、最近はp値のみに着目するような表記を推奨しない学会誌もあります。 仮にr=0.89でp=0.15とかであったとしても、それらの変数を説明変数としておいてしまうと多重共線性の問題が生じる可能性があります。しつこくいえば、あくまでも母相関係数がどうであるかについて検定しているのであって、実データ(実測値)について重回帰分析を行うのですから、この場合のp値に実質的な意味は全くありません。 ちなみに、 > 名義尺度をダミー変数化し、連続変数として扱う場合、 というのは分散分析をしていることになりますね。もし連続型の変数とカテゴリカル型の変数(名義尺度のデータ)が混在していれば、共分散分析ということになります。