- ベストアンサー
Excelを使ったF検定
よろしくお願いします。 あるデータ群A(ある高校の成績)とデータ群B(別の高校の成績)があったとします。分散が等しいと言えるかどうかを計算するためにF検定をします。 FTEST(データA群,データB群)=4%と出力されたとします。 そこで質問です。 1.有意水準を5%としたときに有意差があるといえるのでしょうか。 2.そもそもFTESTの結果4%というのは,何が4%なのでしょうか。右側から2%,左側から2%の合計4%という意味でしょうか。それとも,右側から4%なのでしょうか。 3.2にかかわって,棄却される領域を,右側2.5% 左側2.5%の合計5%と考えるべきなのでしょうか。それとも,右側に5%と考えるべきなのでしょうか。
- みんなの回答 (4)
- 専門家の回答
質問者が選んだベストアンサー
- ベストアンサー
> FTESTは分母が大きい場合も小さい場合も自動的に判定し,(常に分子が大きくなるように調整し)結果を返しているのでしょうか。 Excelがどういう計算を行っているかがわからないので分母の大小を判定しているかは知りませんが、両側確率を返すので気にする必要はありません。 > だとするならば,等分散が否かの検定は,FTESTの返した値が5%を上回るかどうかで判断してよいということでしょうか。 そのとおりです。 > 2 等分散かどうかは両側でよいということでしたが,片側を使わなければいけないような例を少しだけ示していただけないでしょうか。 F分布を使った片側検定で一番使われるのは分散分析です。 分散分析は(群間平方和/群間の自由度)/(群内平方和/群内の自由度)が検定統計量となり、両側検定を行うことはありません。 これは対立仮説では 分子の期待値>分母の期待値 となり、帰無仮説では 分子の期待値=分母の期待値 となるためです。 分子の期待値<分母の期待値 というのはありえません。
その他の回答 (3)
重要なことを忘れてました。 > Excelのヘルプを見ると「片側確率」を返すとあります。 おそらく古いバージョンのExcelを使用していますね? その場合ヘルプの片側という記載は間違いです。 (参考URL1) こういうこともあるので、Excelで統計解析を行うのはあまりお勧めできません。 フリーの統計解析ソフトもありますので、専用のソフトを使ったほうがいいと思います。 (参考URL2)
- 参考URL:
- http://aoki2.si.gunma-u.ac.jp/Hanasi/excel/,http://cse.naro.affrc.go.jp/takezawa/r-tips/r2.html
補足
御指摘の通り,Excel2002を使用しています。つまり,ヘルプファイルの誤植と言うことですね。(ネットでは有名な話だったようですね。わざわざ教えていただいて助かりました。) さて,F検定も片側と両側があることを理解しました。私が使っている本によると,分散比の分母が大きい場合は下側2.5%で判断をし,分子が大きい場合は上側2.5%で判断すると書いてあります。FTESTは両側確率を返すので,FTESTの値を÷2することも理解できます。そこで補足質問なのですが 1 全く同一の集合をFTESTで調べると,1(100%)が返されます。FTESTは分母が大きい場合も小さい場合も自動的に判定し,(常に分子が大きくなるように調整し)結果を返しているのでしょうか。だとするならば,等分散が否かの検定は,FTESTの返した値が5%を上回るかどうかで判断してよいということでしょうか。 2 等分散かどうかは両側でよいということでしたが,片側を使わなければいけないような例を少しだけ示していただけないでしょうか。(まだイメージがわかないので・・・) よろしくお願いいたします。
1. F検定にも片側検定と両側検定があります。 どちらを選ぶかは帰無仮説と対立仮説をどう選ぶかにより異なります。 等分散の検定ならば通常両側検定をします。 どちらか一方の分散がもう片方よりも大きいかそれ以下かを知りたいというような場合は、片側検定になります。 2. 「仕事に役立つExcel統計解析」、「Excel関数大辞典」は持っていないのですが、ヘルプにあるようにFTESTは両側確率(Excel2007と2003の場合)を返しますので、その記述は間違いではないと思います。(参考URL)
- kgu-2
- ベストアンサー率49% (787/1592)
>1.有意水準を5%としたときに有意差があるといえるのでしょうか。 危険率が0.04と算出され、5%で判定するなら、「有意差有り」です >右側から2%,左側から2%の合計4%という意味でしょうか。 t検定は、高いの右側、低いの左側がありますが、F検定は等しいことの検定なので、右も左もないと想います。 分散は等しい(=同じ集団である)、との帰無仮説が成立する確率が4%。20回で1回以下の確率なので珍しいから、仮説は成立しがたい。よって、同じ集団という仮説を否定できる、ということです。 >3.2にかかわって,棄却される領域を,右側2.5% 左側2.5%の合計5%と考えるべきなのでしょうか。それとも,右側に5%と考えるべきなのでしょうか。 2への回答から明らかなように、考えすぎです。
補足
早速御回答いただき,ありがとうございました。補足質問です。 1 Excelのヘルプを見ると「片側確率」を返すとあります。片側があるのなら両側があると思ったのですが,そもそも片側も両側もないと考えて良いのでしょうか? 2 ソフトバンククリエイティブ社から出されている「仕事に役立つExcel統計解析」には,上側累積確率,下側累積確率という言葉が出てきます。また,上側累積確率のみを出すためにFTESTで出力された値を2で割るという表現が出てきます(286ページ)。一方で,同社から出ているExcel関数大辞典のFTESTのページにはFTESTの値をそのまま利用しています。(360ページ) さらに言うならExcel関数大辞典のTTESTのページには,等分散の検定の欄はFTESTの値をそのまま利用しており,等分散でない検定の欄はFTEST÷2をしています。どこかに誤植があるような気がするのですが,なにせ初心者のために困っております。御存知でしたら解説をしていただけないでしょうか。
お礼
ありがとうございました。御礼をするのが遅くなってしまい申し訳ありませんでした。片側検定を使わなければいけない例も示していただけて助かりました。分散分析について自分でも勉強したいと思います。