• 締切済み

相関分析と重回帰分析

大学3回生で、来年度の卒論のために先行研究を読んでいます。 私が書く卒論では統計分析が必要なのですが、 先行研究を読んでいて疑問に思ったことがあるので、質問させてください。 ある論文で、変数間の相関を分析した後、重回帰分析を行っていました。 ところが、相関分析において相関の出ていない変数に対しても重回帰分析を行っており、 その結果、 「相関分析では有意な相関が見られない」にも関わらず、「重回帰分析では有意な結果が見られる」 というような書き方がなされていました。 また、この論文における考察部では、相関分析と重回帰分析をまとめて考察しており、 ほとんど重回帰分析の結果についてしか触れられていませんでした。 相関分析と重回帰分析を両方行う場合、相関がない変数についても重回帰分析を行うべきなんでしょうか? ゼミに教授に質問しにいっても、現4回生の卒論などで忙しいのか、 今度にしてくれ、と言われてしまいましたので、こちらで質問させていただきました。 不勉強で、重回帰分析の仕組みが良くわかっておらず、大変心苦しいのですが、 宜しければ回答していただけると、とても助かります。

みんなの回答

回答No.1

重回帰の偏相関係数と 因子間の相関係数の違いを考えれば明白です 血糖値と食べ物の関係を調べるとします。 つまりたんぱく質、炭水化物、脂質と血糖値の関係です。 血糖値は、脂質ではあがりません。炭水化物だけが、血糖値を上げます(糖新生は今は無視)。しかし、普通の食べ物で相関を調べる場合には、脂質を含めば、炭水化物も摂取しています。 従って、重回帰を使わない限り、よほどたくさんデータを取らない限り、炭水化物の影響を考慮した相関は困難です。 つまり、おなじ脂質の量で、炭水化物が色々異なるような摂取とかを行ったデータが、いろんな脂質の量の場合にデータがあれば、炭水化物によって増える血糖値の量は幅が出きるので、その真ん中に線を通す(最小2乗法)ことはできます。でもこれだけいつも観測データが揃っているとは限りません。 たんぱく質も同様ですから、おそらく、脂質と血糖値 たんぱく質と血糖値に正の相関がでてしまうでしょう。 こうならないために、重回帰が必要です。 重回帰では、他の因子の影響を排除するために、行列式などクラメールの公式などを使って連立方程式を解いているのです。このために重回帰があり、偏相関係数があります。 単なる相関は他の因子の影響を排除していません。従って上のような、相関がないのに、他の因子の影響であるような結果がでてしまう。また、本来は相関があるのに、他の因子が負の相関があるために打ち消しあって、相関がないように見えたりとか、起こります。 なお重回帰については、数式をきちんと追うのであれば、 数理統計学 (数学シリーズ) 稲垣 宣生 (著) に書いてあります。ただし難解です。

関連するQ&A