• ベストアンサー

2種類の散布データの比較

添付画像のようなエクセルの散布図グラフが二つあった時、グラフの分布が似ていて相関関係性があるという結論に持っていきたいのですが、どのような方法を使えば結論に導くことができますか? エクセルの相関係数を求めるCORRELを使って山2ヶ所と谷1ヶ所の相関係数を求めて、似ているかどうかを判断できないかと考えております。 アドバイスが欲しいです。 お願い致します。

質問者が選んだベストアンサー

  • ベストアンサー
回答No.2

返答が遅くなってすみません。 さて、 添付図からは、データ1のX座標とY座標、データ2のX座標とY座標、という4つの数値が読み取れますが、CORREL関数の引数は2組の配列、と規定があるので、4つのデータには対応出来ません。そこで、X座標を一定にする事で、Y値の2組のデータだけをまな板に載せるという工夫をしています。 そうした都合上、Xの値は同じ基準で一定にして頂いた方が良いです。CORREL関数にXの値を入れてないので、どんな間隔にしようが得られる数値は変わりませんが、散布図の「みかけ」が数字上のデータとあまりにかけ離れていると違和感が出るかも知れませんので。 ネット上のサンプルについては、質問者様が具体的にどんな図を見たのかが分かりませんので、信頼に足る答えは用意できません。相関係数は線形を原則とするので、そうした図例が多いものと推測します。今回のケースは、前述した通りX値を一定化することでY値の変化を直線的に捉えていますので、特に問題はないと思います。 最後に、0.7を70%と表現するのは、ちょっとアウトかも…。そもそも相関係数は、単位を持たない無名数で、そんなに厳密な判定をする定規ではなく、おおまかな指標に過ぎません。「相関が強い」とか「弱い相関が有る」といったアバウトな表現を使うのが通例で、唯一の例外は、結果の絶対値が1の時「完全相関」とジャッジするぐらいです。目安程度と心得て用いるのが宜しいかと思います。

その他の回答 (1)

回答No.1

例えば、 A1~A5に、系列1のX値(一定間隔) B1~B5に、系列1のY値 C1~C5に、系列2のX値(一定間隔) D1~D5に、系列2のY値 という元データから、データポイントを平滑線でつないだ散布図を二つ作ったとした場合、 それぞれのY値を二組の配列として、 =CORREL(B1:B5,D1:D5) とすれば、系列1と系列2の間の相関係数が得られます。返される値は、1~-1の実数値で、1に近ければ正の相関があり、-1に近ければ負の相関がある事を表します。特に、絶対値0.7を越える場合、相関が強いと表現する事があるようです。 CORREL使用時には、以下の注意点があります。 (1)参照する二組の配列のデータの個数が同数である事 (2)それぞれの配列の標準偏差が0にならない事

sirokuman
質問者

お礼

ご回答ありがとうございます。 CORREL関数について調べましたがわからないことがあるので重ねて質問させてください。 (1) >A1~A5に、系列1のX値(一定間隔) >C1~C5に、系列2のX値(一定間隔) とありますが、A列+2一定間隔、C列+5の一定間隔でも問題ないのか、同じ+2づつの間隔にそろえるべきなのか。 (2)インターネットでCORREL関数について調べると、サンプルで表示される画像は線形式での比較が多いのですが、添付画像のような多項式での相関を比較できるのか。 (3)正の相関が確認された場合、絶対値を%で表して問題ないのか。 例 絶対値0.7⇒70%の相関関係 以上3点について詳しく教えていただけると幸いです。