- 締切済み
検定方法について
検定方法について教えてください。 数学は苦手なもので、わかりやすい回答(説明)を頂けたら幸いです。 今、下記の分布が直線か否かを判定しています。 X Y 314 -1.18 2009 -0.5 3061 0 9296 0.5 10868 1.18 これに対して、回帰直線と回帰式を作成して、その回帰式から理論値を算出して、検定により直線か否かの判定を行なおうとしておりますが、なかなかうまくいきません。 この分布が直線か否か、判別する方法を教えて下さい。いくつかの方法を試したいので複数の方法を教えて頂けると助かります。 よろしくお願いします。。
- みんなの回答 (2)
- 専門家の回答
みんなの回答
- stomachman
- ベストアンサー率57% (1014/1775)
ANo.1のコメントについて。今更ですが、見落としてました。 離散分布が正規分布なわけないんで、この場合はおそらく「ある正規分布に従うランダム変数Xを0.2刻みで量子化したデータがxである」という帰無仮説を検定しろということでしょうね。 要するに「帰無仮説が正しいとしたときに、こんな結果より悪くなる確率がどれほどあるか」を計算するんですが、「こんな結果より悪く」の部分を具体的な定量的尺度に置き換えてやる必要があります。 たとえば、分布の非対称性に着目して、度数分布の3次モーメントを非対称性の尺度にしてもいいでしょう。 また、ヨコ軸に(このデータから得られる平均と分散を持つ)正規分布の累積値、タテ軸にこのデータの累積値を取ってプロットすれば、もしデータが正規分布に従っているならグラフはほとんど直線になるはず。なので、直線に対する残差の2乗和をずれの尺度にするというのも考えられると思います。 どんな尺度を使うにせよ、「このデータをこの尺度で測った値よりも悪い結果が、帰無仮説が正しい場合に偶然に生じる確率」を計算する。もし計算の答がうんと小さければ、「帰無仮説は誤りだ」と言えます。 ただし、尺度の選び方によっては確率の計算が非常に難しかったりします。あるいは、計算は簡単だけど大抵の度数分布に対して大きな確率が出る(何を持ってきても大抵「何とも言えない」としか結論できない。つまり検定能力が低い尺度である)場合もあります。しかし、もし帰無仮説が正しいのであれば、どんな尺度であれ「何とも言えない」という結論になる筈です。
- stomachman
- ベストアンサー率57% (1014/1775)
データを見れば、もちろん、直線でないのは明らかです。 なので真の問題は、「『ホントは直線であるのに、測定誤差のせいでこうなっちゃってるだけだ』と考えられるかどうか」です。この 『ホントは直線であるのに、測定誤差のせいでこうなっちゃってるだけだ』 を帰無仮説と言います。 1. 帰無仮説を肯定する手段はありません。原理的に不可能なんです。 2. その測定誤差がどういう統計的性質を持っているかを知らなくては、先に進めません。 「測定誤差は既知の分布φ(x)に従うランダム変数xである」と仮定できたとしましょう。 すると、検定ということができる。すなわち、 { 「『ホントは直線であるのに、測定誤差のせいでこうなっちゃってるだけだ』とは考えられない。だからホントに直線じゃないのだ」と主張したとき、その主張が間違っている確率p}(有意水準)が計算できます。この確率pがかなり小さければ、pなりの自信を持って「ホントに直線じゃないのだ」と言える。でも確率pが結構大きかったりすると、「これだけのデータじゃなんとも言えない」という結論にしかなりません。 なので「直線か否か、判別する」ということは不可能。出来ません。 ですが実務に於いては、2で述べたpが大きいときには、「これだけのデータじゃ『ホントは直線かどうか』について何も言えない。ってことは、ま、直線に似てるっぽいね」という結論にしちゃうのが普通です。
補足
回答いただきましてありがとうございました。 併せて教えてください。 直線の検定とは少し異なります。 以下の【Xが1.00・0.8・0.6・0.4・0.2・0.0の6項目の離散分布】のヒストグラムを描くと、X=1.00に偏った分布になります。この分布の形状が正規分布とみなせるかどうかを、検定により判別したいのですが、いい方法がわかりません。。 x Y(度数) 1.00 1000 0.8 800 0.6 200 0.4 100 0.2 50 0.0 10 ヒストグラムを描くと、”X=1.00が最頻値となる偏った分布になるので、これは正規分布として扱わない”といったことを、検定により判別できるのでしょうか?また、判別するための方法も併せて教えて下さい。よろしくお願いします。