ベストアンサー

カイ自乗分布について

2005/07/07 14:06

自由度3以上のカイ自乗分布が、自由度1,2の場合と異なった傾向のグラフになる理由がよくわかりません。数式の説明ではなくて、直感的な説明がありましたら、教えてください。（特に、自由度3以上は、0をとる確率が0になることについて）

noname#112755

数学・算数
回答数2
ありがとう数2

みんなの回答 （2）
専門家の回答

質問者が選んだベストアンサー

ベストアンサー

solla
ベストアンサー率59% (45/76)

2005/07/08 13:15 回答No.2

> 数式の説明ではなくて、直感的な説明がありましたら、教えてください。とのことですが、多少数式を使って説明させていただきます。 #1 さんの回答では違いが出るのが自由度 2 と 3 の間である理由が説明できません。なぜ 3 と 4 の間ではないのか、4 と 5 の間ではないのか、ということになりますね。またχ2分布の自由度は自然数に限りませんし、「違い」というなら、自由度 1 と 2 の間でも違います。 x → 0 で関数の値は、自由度 1 では ∞に発散しますが、自由度 2 では有限です。これについては直感的に理解できる理由というのはないように思います。これは、χ2分布関数の x に関するべき乗項が、x ^ ( n/2 - 1 ) となっており（ n は自由度）、この項がご質問で問題になっている関数の挙動を左右しています。即ち、 n < 2 ではこの項は x → 0 で発散し、n = 2 で定数に、 n > 2 では x → 0 で 0 になるためで、2 という値を境にしているのは結局 n/2 の分母が 2 であるからという理由以外の何者でもありません。この 2 に直感的意味付けは難しいように思います。それに、 > （特に、自由度3以上は、0をとる確率が0になることについて）という記述から察すると、おそらく誤解なさっていると思いますが、χ2分布は確率密度関数なので、関数の値が確率を示すわけではありません（念のために申し上げれば、χ2分布の確率密度関数は、x ≦ 0 では 0 と定義されますので、自由度 3 未満でも x = 0 で 0 です）。確率密度関数を積分して初めて確率になります。即ち、 x が a から b の間の値をとる確率は、 Prob ( a ≦ x ≦ b ) = ∫χ2 ( x ) dx　（積分区間は x = a から x = b まで）となります。連続分布の場合 x が特定の値をとる確率は、上式で積分区間の下限と上限が一致することになり、常に 0 ですが、これは実数の連続性を考えれば当然です。確率として考えるには、χ2分布の分布関数 F( t ) F( t ) = Prob ( 0 ≦ x ≦ t ) = ∫χ2 ( x ) dx （積分区間は x = 0 から x = t まで）即ち、x が t 以下の値をとる確率を t の関数として表したもの、を使いますが、この関数は自由度によらず t = 0 で 0 をとり、t → ∞ で 1 に漸近する単調増加関数になります。関数曲線は自由度の違いによって滑らかな変化をし、密度関数のような不連続性を示しません。これは　Excel の chidist() 関数を使ってグラフを描いてみると確かめられると思いますので、 Excel が利用できるなら試してみるとよいと思います。 1 - chidist( x, df ) が、自由度 df の分布関数の x における値になります。したがって自由度による確率分布の変化という意味では、ご質問にあるような自由度 1, 2 と 3 以上で、異なる傾向を示さないのです。

質問者

お礼 2005/07/08 14:04

たいへん勉強になりました。ありがとうございました。これからもよろしくお願いします

質問者

補足 2005/07/08 13:52

勉強不足でごめんなさい。御指摘ありがとうごさいます。 EXCELで確かめてみました。なるほど分布関数をみると定性的な振舞いは変化しないのですね! 勉強になります。 >x に関するべき乗項が、x ^ ( n/2 - 1 ) となっており(続く) やはり、こういう理解以外は難しいのでしょうか。なにかコメントある方お願いします。

その他の回答 (1)

at9_am
ベストアンサー率40% (1540/3760)

2005/07/07 17:36 回答No.1

直感的に、というと難しいですが、やってみましょう。まず自由度ｎのχ^2分布は x = x1^2 + ... + xn^2 になっています。x1,...,xn はそれぞれ独立な、標準正規分布に従う確率変数です。二乗和ですのでそれぞれの項は非負になりますから、x=0 となるのは x1=...=xn=0 となっているときであることが分かります。逆に言えば、一つでも０でない物があれば x は０になりません。しかも、x1,...,xn は標準正規分布に従っているので、絶対値をとって平均を取れば１になります。従って、二乗すれば１より小さいものは０により近付きますから、n=1では０付近が厚くなります。 n=2でも同じ理屈で０付近が厚くなりますが、今度は２つが０に近い数値をとる必要があるので、その分だけ確率が小さくなってしまいます。ところがn=3となれば、その内一つも大きい値が出ない確率が非常に小さくなるため、０付近が薄くなり、０の時に０になります。

質問者

お礼 2005/07/08 13:49

ありがとうございました。これからもよろしくおねがいします。

質問者

補足 2005/07/08 13:49

＞ところがn=3となれば、その内一つも大きい値が出ない確率が非常に小さくなるため、０付近が薄くなり、０の時に０になります。という点がいまいち理解できません。Nがおおきくなるにつれて徐々に小さくなっていくのならわかるのですが、グラフをみると振舞いがガラっとかわってしまってしまうのがわかりません。なにか理解の助けとなる助言等ありましたら、よろしくおねがいします