- ベストアンサー
回帰分析でどちらが原因かを特定する方法
回帰分析でどちらが原因かを特定する方法分かりますか? XとYに相関があるとわかったとき、Xが原因でYを引き起こしているのか、Yが原因でXを引き起こしているのか調べるためにはどうしたらよいでしょうか?
- みんなの回答 (2)
- 専門家の回答
質問者が選んだベストアンサー
回帰分析だけではわかりません。 因果関係を調べる確かな方法はないと思います。「たぶんそうだろうな」と見当を付けていろいろな事情からこちらが原因でこっちが結果だと導き出すしかないでしょう。 「たぶんそうだろうな」と見当を付ける方法の1つとしては、「アソシェーション分析」という方法があります。 たとえば、 p(Y):全体の中でYが起こる確率 p(Y|X):Xが起こった前提でYが起こる確率 の2つを比較して、p(Y|X)/p(Y)>1なら、Xが効いていると判断します。これが1より大きいほどXが原因の可能性が大きくなるというようなことです。
その他の回答 (1)
- stomachman
- ベストアンサー率57% (1014/1775)
回帰分析は「Xを知ったときにYを最も旨く推測する計算方法」を求めるもので、たとえば一次式 Y = a X + b のような計算方法を与える。しかし、この式を X = (Y-b)/a と変形して「Yを知ったときにXを推測する」という目的に使うのは完全な誤りです。(よく「脳年齢」だの「肌年齢」だの言ってるのは、この「完全な誤り」の例です。)「Yを知ったときにXを推測する」には、改めて回帰分析をやり直さなくちゃいけません。でも、だからと言って回帰分析が「Xが原因でYが結果だ」ということを前提にしている訳ではなくて、単に「簡単に測れる方をX、測るのが難しい方をY」にしているだけです。 さて、相関分析ではどっちがXでどっちがYということはありません。従って、相関関係だけからじゃ因果関係は分かりません。ただ単に「どっちが先に生じたか」が明らかである場合に「もしかしたら、先に生じた方が原因で、後のが結果なのかも?」と思うだけのことです。ですが、「どっちも結果であって、それらに共通な原因がある」ということもしばしばあります。(たとえば、夕焼けを観測した翌日は晴天が多い、という相関関係が証明できても、夕焼けが明日の晴天の原因ではないでしょ。また、日本人の100m走のタイムと裸眼視力との間には強い相関がありますが、もちろん、それらのバラツキに共通の原因は年齢でしょう。) 「原因と思われるもの」をワザと加えた場合と、加えない場合とで(ほかの条件はみな同じにして)、それぞれどのぐらいの頻度で「結果」が生じるかを実験できる場合には、「多分これが主な原因で結果が生じるんだろう」とか「これが原因かと思ったけれど、どうも違うみたいだ」などの検討ができます。それには尤度分析やベイズ統計学などの方法が使えるでしょう。 一方、「原因と思われるものがどういうメカニズムで結果を引き起こすか」を解明すれば、何が原因で何が結果かも明らかになる。このアプローチは物理学・化学などではアタリマエの態度ですけれども、医学ではちょっと違う。メカニズムが非常に複雑だからです。たとえば疫病が発生した場合、メカニズムの研究をしているヒマがあったら、相関関係を手がかりにして原因と疑われるものをとにかく潰す対策を打たねばなりません。水俣病は、メカニズムの研究にかまけて対策を放置したために被害が拡大した悪例のひとつです。和歌山毒カレー事件も同様。ですが、つい最近の集団食中毒事件でも、メカニズム(食品工場におけるウィルスの検出)を同定するのを待って食品を回収する命令を出す、なんて愚かなことが繰り返されていますが。
お礼
詳細に有難うございました。いろいろな角度で頭が整理出来ました。
お礼
シンプルな回答ありがとうございます。