- ベストアンサー
因果関係を記すのに適した統計モデル
はじめまして、shigure2005と申します。 現在、いくつか連なる因果関係を持ったデータの 解析をしようと思っているのですが、因果関係を 表現するのに適したモデルの表記法にはどのような ものがあるのでしょうか? 因果関係は以下のようになってます。矢印の左が 原因、右が結果となります。 100個くらいのデータ→5つくらいのデータ→一つのデータ また、その表現方法に必要な知識の書かれたお勧めの 本などがありましたら教えてください。現在、 グラフィカルモデリングなるものがこれに当たる のではないかと考え、宮川氏の「グラフィカル モデリング」を借り、これから読もうと考えております。 ベイズなどのモデルもあると聞いたのですが、 ご存知の方がいらしたら、どうぞよろしくお願いします。
- みんなの回答 (3)
- 専門家の回答
質問者が選んだベストアンサー
グラフィカルモデルはグラフを用いてモデリングをすることの総称のようなものです。その一つにBayesian Networkもあります。 Bayesian Networkは全体の確率を変数間の条件付確率の積(結合確率分布)により表現するモデルになっています。一般的にはこの条件付確率はCPテーブルで計算されるので、変数の属性はカテゴリタイプとなります。 変数の属性が数値変数であれば、共分散構造分析という手法があります。基本的にはパス解析と因子分析の合体したようなものになり、潜在変数を取り扱うことも可能です。(新たな変数というのがこれのことならだが。。。) 共分散構造解析の本は検索すれば色々出てくると思いますので一つだけ。「多変量解析の展開」 岩波書店 統計科学のフロンティア 5を挙げておきます。 Bayesian Networkの本は和書は良く知りません。洋書ですが、「Bayesian Networks and Decision Graphs」 Springer Statistics for Engineering and Information Science. Jensen著 HUGINというソフトウエアを作った人の本です。
その他の回答 (2)
- goma_2000
- ベストアンサー率48% (62/129)
答えになっていないかもしれませんが。 因果関係というのは深遠なものです。その意味で、統計解析では厳密な意味では因果関係はわからないでしょう。そもそも、厳密な意味での因果関係というのも定義できないかもしれません。。。 そうは言ってもある程度のことはわかります。以下に、わからない例を簡単に紹介します。(先に紹介した本の中にあります) よく当たる天気予報というのが合ったとします。その場合、データを分析すると、天気予報が晴れといえば晴れる。雨といえば雨が降る。ということが判ります。このことから、天気予報が明日の天気の原因になっているといえるか?ということですね。現実のメカニズムを知っていればこのような間違いは犯しませんが、データからはこういう結果が得られることもあるということです。 実際に分析をする時にはこのようなことを気をつける必要があります。実際、Bayesian Networkなどでは確率分布的に等価なグラフを幾つも書くことが可能です。 最後に、回帰分析は単回帰でなく重回帰分析では多変数と1変数との間の関連を求めることが出来ます。本質的な違いは、どの変数でどの変数を回帰するかを最初に使う側が指定するところにあります。
お礼
ご回答ありがとうございます。 因果関係は確かに、厳密な定義ということを考えると なかなか難しいですね。そこにはヒューリスティック な判断が介在し、「この閾値以上で、かつこれらは実験的にも 因果の関係がありそうだ」ということであれば、因果関係と いうようになるんですね。 また回帰分析についても、ご指摘ありがとうございます。 非常に参考になりました。 またご質問することがあるかもしれませんが、その際には どうぞよろしくお願いします。
- Ideasforlife
- ベストアンサー率40% (63/155)
因果関係をグラフ表現したい という意味でしょうか? ご質問で書かれているように 100個くらいのデータ→5つくらいのデータ→一つのデータ となっていることが、すでにわかっているのであれば、あとは変数間の依存関係を統計的手法で明らかにしていくことが、次のステップのように思えます。 とりあえず、グラフィカルモデリングをお読みになれば、よいのではないでしょうか? ベイズのモデルというのは、おそらくベイジアンネットのことかと思います。ベイジアンネットワークもしくはベイジアンネットで検索してみてください。 構築のための支援ソフトウエアも市販されています。
お礼
ご回答ありがとうございます。 やりたいことは、現在わかっているこの因果関係と、 それぞれの変数のデータを用いて、新たな変数間の 因果関係、そして、それらの強さを求めることなのです。 グラフで表現するというのは、それを実現する ために役に立つかと思って調べている状況です。 すでにわかっているデータ、因果関係を効率よく 利用して、そのようなことを行う方法としては、ほかに どのようなものがあるのでしょうか?
お礼
ご回答ありがとうございます。 そのような仕組みになっているんですね。私は生物系の研究を しており、解析の必要性から統計学を勉強し始め、 現在がむしゃらに基礎統計を覚えている状況です。本を引けば だいたい論文や本は読めるようになったのですが、全体の 体系的な構造や、概念がいまいちつかめていません。 調べていたときに、webで「統計解析では厳密には因果関係を 求めることはできない」というような記述があったので、 多少混乱しております。 2変数間の因果関係を求めるときには回帰分析、多変数間の 複雑な因果のネットワークを解析するときには、質的変数なら Bayesian Network、量的変数なら共分散構造解析を使うという 理解でよろしいでしょうか? どうぞよろしくお願いします。