• ベストアンサー

相関係数と回帰直線の使い分け

相関係数は2つの変数とも無作為型であること、回帰直線は片方の変数は固定型であること・・・ということが、統計の本には書いてあります。 なぜでしょう? 片方の変数が固定型であった場合、相関係数を求めてはいけないのでしょうか?

質問者が選んだベストアンサー

  • ベストアンサー
noname#21649
noname#21649
回答No.4

>教えていただけませんか 回帰線は.水準を通常.等間隔に5-10点とり水平軸に記載し.その測定値を垂直軸に記載します。各水準ではそれぞれ水準別に.平均値が存在し.平均値を中央値とするガウス分布になっている場合に限って.回帰線を求めることができます。 (回帰線からの計算値-測定値)の度数分布を求めて.正規分布になっているときに限って.回帰線が意味を持ちます(誤差分析という作業です)。信頼限界を計算してみればわかるとは思いますが.等間隔でなかった場合には.信頼限界がばらけます。 相関曲線では(話しを簡単にする為に.2次元.1次方程式の場合に限ります). 横軸と縦軸それぞれに.平均値が存在し.平均値を中央値とするガウス分布になっている場合に限って.相関曲線を求めることができます。 縦軸・横軸を平均値からのずれを標準偏差の倍数に換算して.平均値からの距離の度数分布を求めて.正規分布になっていない場合には.意味がありません(計算の名称忘却.以下誤差分析と書きます)。 回帰線と相関曲線では仮定とする値の分布関数が決まっています。この仮定条件を満たせないので.回帰線の場合に相関曲線を求めることが無意味なのです。 通常は.正規分布であることを仮定して計算し.誤差分析をして正規分布であったならば.統計処理に間違いはなかったとします。 数学的証明は.数式でそれぞれの方程式を定理から導入してください。ここにはかけません。

brassard
質問者

お礼

そもそも仮定条件を満たしていない・・・なるほど、ありがとうございます。かなりすっきりしました。

すると、全ての回答が全文表示されます。

その他の回答 (3)

noname#21649
noname#21649
回答No.3

>なぜでしょう? 数学的にいみがありません。 相関係数を定義から導入している内容が.最近の本に見かけないのです(古い本を探してみてください。)が. 定義を満足していませんので.おなじようなけ遺産をしても「相関係数」以外の数値を求めることになります。

brassard
質問者

補足

数学的に意味がない理由を教えていただけませんか?

すると、全ての回答が全文表示されます。
  • ymmasayan
  • ベストアンサー率30% (2593/8599)
回答No.2

気持ち的にはなんとなく判りますが、実用上は余り気にした事はありません。 片方の変数が固定型であろうが、それをわかった上で相関係数を求める事はよく やります。やってはいけないという気はしません。 ただ、相関係数の分析自体、相関があるかどうか判らないものを、相関係数で 関係ありと結び付けていくのが基本なわけですから、理論的にはきっと2つの 変数が対等という事が前提なのでしょう。 気を付けないといけないのは、相関係数がある値以上でないと回帰式を求めても意味がないということです。 いずれにしても、教科書の気持ちを汲みつつ、実用的には、ある程度、自由でよいという事だと思います。やっているうちに、経験的に判ってきます。

brassard
質問者

お礼

>相関係数の分析自体、相関があるかどうか判らないものを、相関係数で 関係ありと結び付けていくのが基本なわけですから、理論的にはきっと2つの 変数が対等という事が前提なのでしょう。 なるほど・・・、一番納得しやすいお答えです。ありがとうございました。

すると、全ての回答が全文表示されます。
  • sen-sen
  • ベストアンサー率31% (66/211)
回答No.1

得られた標本における2変数の関係を考えるときに、相関係数と回帰直線がよく用いられます。 しかし、この両者には、次のような違いがあります。 相関係数では、2変数X、Yとの関係は対等です。 しかし、回帰直線では、例えば、YのXへの回帰直線では、Xは独立でYはXに従属する変数である。ある検査値の加齢による変化を調べる場合には、年齢が独立変数X、検査値が従属変数Yになるが、これを逆にすることはナンセンスです。 このようなことをその統計の本は言いたいのではないでしょうか。

brassard
質問者

お礼

ありがとうございました。回帰直線のご説明にはなるほどと思いました。

すると、全ての回答が全文表示されます。

関連するQ&A