• 締切済み

相関がないのに相関係数が1???

相関係数の意味を考えていて、理解できないことが出てきたので教えて下さい。 変数Xと変数Yの相関係数の求め方は、データ数がnの時、  1.変数X,Yの平均値を求める。ここでは、X^、Y^と書くことにします。  2.変数X,Yの標準偏差を求める。ここでは、σx、σyと書くことにします。  3.変数X,Yを基準化する。     基準化したX=(X-X^)/σx、 基準化したY=(Y-Y^)/σy  4.基準化したX,Yの積の平均が相関係数である。     r=1/n・Σ{(基準化したX)・(基準化したY)} となります。 基準化したXと基準化したYの積が全て1のデータの場合、 例えば、(1,1)、(0.5,2)、(0.4,2.5)、(0.1,10)、(0.01,100)、(-1,-1)、(-0.5,-2)、(-0.4,-2.5)、(-0.1,-10)、(-0.01,-100)‥‥‥ 双曲線になりますが、平均値と標準偏差で元のデータに戻しても、双曲線みたいなデータの散布図になります。つまりXが大きければYも大きいという関係がないにもかかわらす相関係数は1になってしまいます(というか1になるようにデータを選んだ)。 考え方に間違いがありますか。

みんなの回答

  • inqstv
  • ベストアンサー率55% (5/9)
回答No.3

ご提示のデータ例では、そもそも相関係数は1にならないと思いますが。(見えている10個のデータでは、およそ0.04になると思います。)

nayamukun
質問者

お礼

基準化したデータを積が1になるように調整したことで、基準化されてない状態にしてしまってました(基準化:平均がゼロ、標準偏差が1になるようにすること)。 悩みは解決しました。回答いただいた3名の方、ありがとうございました。

  • solla
  • ベストアンサー率59% (45/76)
回答No.2

一般に、Xが標準化(基準化)されているならY=(1/X)は標準化されません。 したがって > 基準化したXと基準化したYの積が全て1のデータの場合、 という前提が誤りです。そのようなデータは一般には存在しません。 唯一、データの組が(1,1)、(-1,-1)の場合にX,Yともに標準化されていますが、この場合は2点ですので必ず一直線上に存在し、r=1と矛盾しません。

  • chirubou
  • ベストアンサー率37% (189/502)
回答No.1

参考 URL にもありますように、相関係数は一次式で近似可能な「相関」について言っているだけで、双曲線や2次式以上の高次な式での関係については、相関係数からは分かりません。 てな感じでしょうか。

参考URL:
http://ja.wikipedia.org/wiki/相関係数