分散値に基づく比較と検定方法

2009/08/08 12:58

このQ&Aのポイント

統計初心者の方から、分散値に差があるかどうかを検討する方法について質問があります。
分散値の等分散性を考えるためには、F検定やShapiro-Wilk検定などを使用することができます。
また、複数の群を比較する場合には、T検定でのボンフェローニー補正が必要ですが、分散値の検定にも同様の補正が必要かどうかは分かりません。

分散値だけの検定方法

統計の初心者です。２群もしくはそれ以上の群の比較についての質問です。一般的に、比べたい物が正規分布に属していると仮定した時、平均値の差をT検定を使って、差があるかどうかを検討します。では、その２つのグループの平均値ではなく、分散値に差があるかどうかを考える事は可能なのでしょうか？すでに正規分布としていると前の文章で仮定しているので、分散値に差があるかどうかを検討するのはおかしい事なのかもしれませんが… 分散値の等分散性を考える上で、F検定やShapiro-Wilk検定なる物があると聞いたのですが、これはそれぞれの群が等分散になっているかを検討する物だと思っています。では、お互いの分散値が同じなのか違う物なのかを検討するのは無理なのでしょうか？例えば、２つの定規を作る機械があるとします。１つの機械で３０cm定規を作った時の、それを１つ１つきちんと計測できる測定器で計測すると、出来上がった定規にプラスマイナスで誤差が出てくると思います。次にそのもう１つの機械で３０ｃｍの定規を作ったとします。同じように計測すると、出来上がった定規にも誤差が出ると思います。では、この機械は同じ性能を発揮しているのかどうかを検討する時、平均値には差が出てこないと思います。しかし、これだとこの機械は精度的に大丈夫かどうかを考える時に、誤差つまり分散値のばらつきが同じかどうかを検討する必要があると思います。こんな時はどうしたらよいのでしょうか？またもう１つ機械が増えて、３つの場合はどうなるのでしょうか？作った個数が多いと、T検定をした時、ボンフェローニー補正をかけると思いますが、分散値の検定にもボンフェローニー補正をかけるのでしょうか？長文でわかりにくい所があるかも知れませんが、統計の本やインターネットを検索していくとわからない事だらけで… 教えて下さい。よろしくお願いいたします。

sumaabe
お礼率30% (25/81)

数学・算数
回答数3
ありがとう数2

みんなの回答 （3）
専門家の回答

質問者が選んだベストアンサー

ベストアンサー

noname#227064

2009/08/08 16:13 回答No.2

統計方法の流れを知りたいとのことなので、簡単に説明してみましょう。例えば、群間に平均の差があるかどうか知りたい場合なら、１．母集団の正規性を正規確率プロットやShapiro-Wilk検定等で確認。２．１で正規分布でなかったらMann-WhitneyのU検定(2群)又はKruskal-Wallis検定(多群)等のノンパラメトリック検定を行う。　　（厳密にはこれらも等分散であることが必要）３．１で正規分布であったら、F検定(2群)又はBartlett検定(多群)等で等分散を確認。４．３で等分散でなかったらWelchのt検定を行う。　　分散分析もWelchの方法のような方法があります。５．３で等分散であったら、t検定(2群)又は分散分析(多群)を行う。という流れになるでしょう。なお、等分散の検定をせずにいきなりWelchのt検定をした方が良いという人もいます。 > F検定、バートレット検定はT検定、分散分析を行う前段階と書いてあったのですが、私の解釈だと逆になっている感じがあるのですが、私の解釈が間違っているのでしょうか？上の流れでも書いたとおり、t検定、分散分析は正規分布かつ等分散である必要があるため、F検定、バートレット検定で等分散を確認します。 > まず、仮定しているのが正規分布と言う所ですが、正規分布かどうかはお答えから、「Shapiro-Wilk検定」を用いて、今回の機械の製品（定規の長さ）が正規分布になっているかを検討する事ですね。 > ここで、ｐ＜０．０５となったら、この製品は正規分布に従っているとできるのですか？いえ、p値が有意水準より小さいなら「正規分布ではない」といえます。 > 私が知りたい所として、製品定規の長さ平均値の違いよりも、機械が同じ製品を作っていると言う事ですから、分散値の分布状態が同じであるか、つまり等分散になっているかをですから、F検定をして、２群間の統計値がｐ＜０．０５ならば、この製品は同じような分散値をもっているでよろしいでしょうか？ > すわなち２つの機械は同じような精度を有していると考えてよろしいでしょうか？ p値の解釈が逆になっています。（もっとも、p >= 0.05だったからといって等分散とは言えないのですが）平均の差については知る必要がないなら、上の流れで書いたようにt検定等をする必要はありません。 F検定等までで十分です。 > 今書いていて、気がついたのですが、誤差の検定に関してもF検定、多群間の比較ならバートレット検定でいいのですか？誤差の検定とは何を意味していますか？誤差というと、母数と標本から得られた推定値との差を意味すると思うのですが…

質問者

補足 2009/08/08 23:56

丁寧にご回答いただきありがとうございました。 P値の解釈が間違っていたのですか… 「Shapiro-Wilk検定」で正規性を確認したのですが、この場合、「得られた定規の長さは正規分布に従っていない」と言う帰無仮説において、p<0.05で仮説が棄却されて、正規分布に従っていると判断しました。 F検定の場合も同じです。「等分散性がない」と言う仮説のもとで、有意水準以下だと仮説が棄却されて、等分散であると思っていました。逆だったのですね？流れを書いていただいたので、理解できたのですが、正規分布に従っていないとした場合の２番ですが、もし２番で正規分布でないとした場合、平均値を考えるのはわかったのですが、分散値の違いを考える事は不可能なのでしょうか？前に教えていただいた、URLの中に正規分布でなく、多群間の比較ならルーベン検定をと書いてありました。では2群間ならどうなりますか？また、私の中で「誤差とは」平均値を考えて、与えられた「平均値」から「個々の得られた定規」の「差」を言う物だと思っていましたが、私が考えていた物はなんと表現したらよいのでしょうか？とりとめのない質問になっているかも知れません。統計の初心者という事に免じて、教えていただければと思います。よろしくお願いいたします。

その他の回答 (2)

noname#227064

2009/08/09 08:27 回答No.3

p値についてもう少し説明してみましょう。検定では「母集団AとBの○○は違う」という対立仮説と「同じ」という帰無仮説を立てます。ここで帰無仮説が正しいとした場合において、p値は得られた検定統計量（t値やF値等）より極端な統計量が得られる確率を意味します。 p値が有意水準より小さい値であったら、帰無仮説において滅多におきないことがおきたので、帰無仮説が間違いだったのだろうと結論付けるのが検定です。 > 前に教えていただいた、URLの中に正規分布でなく、多群間の比較ならルーベン検定をと書いてありました。では2群間ならどうなりますか？ 2群でもルーベン検定を使用して構いません。誤差については、最初のご質問で > 誤差つまり分散値のばらつきが同じかどうかをと書かれていたので誤差と分散を同じと考えているのかと思ったためNo.2で確認させてもらいました。 No.2の補足の認識でも大丈夫です。

質問者

お礼 2009/08/09 13:47

私の質問におつきあいいただき、本当にありがとうございました。色々、統計の本を買って読んでみた物の、すっきり頭の中で整理できなく、性格からどうしても、流れを作らないと理解できない所がありました。今回の分散を取り上げて、細かい所まで教えていただき本当に感謝しております。また、わからない所がありますので、スレッドを変えて質問させていただきたいと思っているので、よろしければ、またよろしくお願いいたします。

noname#227064

2009/08/08 13:59 回答No.1

> では、その２つのグループの平均値ではなく、分散値に差があるかどうかを考える事は可能なのでしょうか？ > すでに正規分布としていると前の文章で仮定しているので、分散値に差があるかどうかを検討するのはおかしい事なのかもしれませんが… 仮定しているのは正規分布というだけで、パラメータ（平均や分散）が同じといっているわけではないですよね？だから、これに対する回答は「可能です」となります。 > 分散値の等分散性を考える上で、F検定やShapiro-Wilk検定なる物があると聞いたのですが、これはそれぞれの群が等分散になっているかを検討する物だと思っています。 > では、お互いの分散値が同じなのか違う物なのかを検討するのは無理なのでしょうか？「お互いの分散値が同じなのか違う物なのか」とは等分散か否かということとどう違うのでしょうか？あと、Shapiro-Wilk検定は等分散の検定に使うものではなく、正規性の検定に使います。 > こんな時はどうしたらよいのでしょうか？ > またもう１つ機械が増えて、３つの場合はどうなるのでしょうか？正規母集団としてよいなら、2群の場合はF検定、それ以上の群ならバートレット検定を使用します。（バートレット検定：http://ja.wikipedia.org/wiki/%E3%83%90%E3%83%BC%E3%83%88%E3%83%AC%E3%83%83%E3%83%88%E6%A4%9C%E5%AE%9A） > 作った個数が多いと、T検定をした時、ボンフェローニー補正をかけると思いますが、分散値の検定にもボンフェローニー補正をかけるのでしょうか？「つくった個数」ではなくて「機械」の間違いですね。全ての群の分散は同じかどうかだけを知りたいなら、ボンフェローニ補正は必要ありませんが、分散の対比較を行う場合は必要になるかもしれません。

質問者

補足 2009/08/08 14:35

早速のお返事ありがとうございます。流れと共に私の考えを今回の機械を用いて説明させて下さい。まず、仮定しているのが正規分布と言う所ですが、正規分布かどうかはお答えから、「Shapiro-Wilk検定」を用いて、今回の機械の製品（定規の長さ）が正規分布になっているかを検討する事ですね。ここで、ｐ＜０．０５となったら、この製品は正規分布に従っているとできるのですか？次に、正規分布とわかればその時点で、長さの平均値に関してT検定を用いる事になりますよね。また、分散値に関しては２群間の分散値が同じかどうか、つまり等分散かどうかをF検定になるという事でよろしいでしょうか？私が知りたい所として、製品定規の長さ平均値の違いよりも、機械が同じ製品を作っていると言う事ですから、分散値の分布状態が同じであるか、つまり等分散になっているかをですから、F検定をして、２群間の統計値がｐ＜０．０５ならば、この製品は同じような分散値をもっているでよろしいでしょうか？すわなち２つの機械は同じような精度を有していると考えてよろしいでしょうか？今書いていて、気がついたのですが、誤差の検定に関してもF検定、多群間の比較ならバートレット検定でいいのですか？ F検定、バートレット検定はT検定、分散分析を行う前段階と書いてあったのですが、私の解釈だと逆になっている感じがあるのですが、私の解釈が間違っているのでしょうか？ボンフェローニー補正は機械の個数が多くなった時に採用されるんですね。色々、補足なのに沢山書かせていただきました。個人的には、統計方法の流れを考えたいと必死なのですが、今回のように分散値の検定、誤差検定（？）を考える上での考え方がわかっていません。アドバイス、もしくはご教授よろしくお願いいたします。

分散値に基づく比較と検定方法

分散値だけの検定方法