- ベストアンサー
相関係数が1になるのはなぜ
データ群Aとデータ群Bの相関係数を調べようとしています。 データ群Aはy=x データ群Bはy=2x-5 0<=x<=10 このデータ群の相関係数を 共分散/(√Aの分散×√Bの分散) で計算すると相関係数が1となります。 明らかにデータ群AとBが違っているのに相関係数が1になるのはなぜなのか、また、このデータ群の相関係数の正しい求め方を教えてください。 よろしくお願いします。
- みんなの回答 (3)
- 専門家の回答
質問者が選んだベストアンサー
リンク先あたりを読むと良いかもです。簡単に言えば「どのくらい比例関係(線形従属の関係)に近いか」を示す指標のようなものなので、比例していれば1(または-1)になります。 y=ax+bで、 xの平均値をpとすれば、yの平均値はap+bですからyの分散は √Σ(a(Xn)+b-(ap-b))^2 =√Σ(a(Xn-ap))^2 =√Σ(a・(Xn-p))^2 =a・(√Σ(Xn-p)^2) 一方、xのほうはというと √Σ(Xn-p)^2 なんで、両者を掛け算すると、 a・(√(Σ(Xn-p)^2)^2) =a・(Σ(Xn-p)^2) で、分子を見ると、 Σ(xn-p)(a(Xn)+b-(ap-b)) =Σ(xn-p)(a・(xn-p)) =a・(Σ(xn-p)^2) なーんだ、一緒ジャン・・・とな
その他の回答 (2)
- Ishiwara
- ベストアンサー率24% (462/1914)
データAとデータBが互いに関数関係で結ばれているときに相関係数を求めるのは無意味です。今回は1次式なので、あなたが間違いに気付くことができましたが、もし2次式だったら相関係数が±1にならないので、気付かないまま過ちを犯したでしょう。 相関分析とは「互いにゆるい関係で結ばれている」場合に、そのゆるさ(きつさ)を求めるものです。「一方を決めれば他方が一意に決まる」といった「100%きつい関係」の場合には、行いません。
- backs
- ベストアンサー率50% (410/818)
数式的にはNo.1さんの回答の通りなのでしょうが、コンピュータを使って確かめてみるのが一番手っ取り早いというか、わかりやすと思いますよ。 Excelでもできますが、簡単なのはRでやることです。ダウンロードしてインストールするのが面倒で嫌ならweb上で試すこともできます(http://bayes.math.montana.edu/Rweb/Rweb.general.html)。 以下のコードをそのままコピペして、[Submit]ボタンをクリックすればOKです。 # ここから x <- seq(0, 10, 0.01) groupA <- x groupB <- 2*x - 5 soukan <- cor(groupA, groupB) plot(groupA, groupB, main=soukan) # ここまで
お礼
ありがとうございます。 確かに比例しているから相関係数は1ですね。 では、データA群とB群がどれだけ近いかを示す指標はどのように求めるのか教えていただけませんでしょうか。 よろしくお願いします。