• ベストアンサー

差の検定

とある切削機械があり、ある条件下での切削部品が30個(A群)作製されたとします。っで、条件を変化させて新たに切削部品30個(B群)を作製したとします。 この部品A群とB群の寸法について、有意差の有無について、検定をしたいのですが、具体的にはどのような検定をすればよいのでしょうか? F検定?t検定? 今までは、A群、B群ともにそれぞれの個体の寸法が測れるので、なんとなく平均値で比較していただけなのですが、実際に検定という概念を使いたいのですが・・・。 すみませんが、よろしくお願いします。

質問者が選んだベストアンサー

  • ベストアンサー
  • proto
  • ベストアンサー率47% (366/775)
回答No.2

>U × (1/Na+1/Nb)の 平方根のことなんでしょうか? >となると、Na=Nb=30なんで、U÷15ってことでしょうか? その通りです、かけ算の記号を省略して書きました。 >この意味がどうしてもはっきりわかりません。【Xa≠Xbとは言えない】と言っても【Xa=Xbと言える】とならないことは、知っているのですが、これは、つまりどういうことなんでしょうか?  >かいつまんで言うと、限りなく【Xa=Xb】 だけど、ほんのちょっとだけ、Xa≠Xbっていう可能性もある、ということなんでしょうか? 概ねそのような理解でいいと思います。 例えば、実際、A群とB群の平均値に差があったとします。 その平均の異なる母集団から標本を採って検定をするわけですが、標本数nが2とか3だった場合、自由度が低すぎるので、Xa≠Xbとは言えない場合がほとんどになります。 つまり標本数が少なければ、偶然差が出たと言いやすくなるのです。 このことはnが小さければ平均がばらつきやすいためにおこります。 統計では、ある量を測ったとき、真の値xに誤差σがついて、x+σが実際観測される値になると考えます。 もし誤差が無ければ、平均なんか取らなくても1個の部品を測ってしまえばいいことになりますよね。 平均を取る意味は、たくさんの平均を取ることで誤差が互いに打ち消し合って、結果平均値が真の値xに近づくだろうと信じるからなのです。 しかし標本数が少ないとこの誤差打ち消しの効果が少なく、偶然に平均値と真の値がかけ離れることも考えられます。 そのため、標本が少ないと対立仮説が棄却されにくくなるのです。 逆に言うとこのことは、標本数が多ければ、Xa=Xbだと思っていたものがXa≠Xbになることもあると言うことです。 例えばt分布の表を見てみると、 自由度10、α=0.01ではt<3.169ですね。 もし検定したいTの値が3.00だったとしたら、T=3.00<3.169よりXa≠Xbとは言えないと言うことになります。 でも、もっと標本を多く採ってきて自由度を120にしてみるとt<2.617で、T=3.00>2.617よりXa≠Xbと言える、という結果になります。 「なぁんだ、標本が少なかっただけでちゃんと有意差があったんだなぁ」ということです。 今回のご質問の検定でも、標本をそれぞれ30ずつ取ってきてXa≠Xbとは言えないという結果ですが、もし標本を300ずつとればXa≠Xbと言えるかもしれません。 ですから、"今回は"Xa≠Xbとは言えないよという風に考えて、あえてXa=Xbと断言はしないのです。 私は、人間を相手にした測定実験でよく検定をしていましたが、有意差が出なかったときでも、測定結果を見つつ「今はぎりぎり有意差出てないけど、nを増やせば有意差出そうだねぇ」というような話をしていました。 Xa≠Xbとは言えないという結果が出ながらも、本当はXa≠Xbだと信じてこのような話をしていたのですよ。

Life_is
質問者

補足

またまた早速ありがとうございます。非常にくわしく、かつ、わかりやすく説明してくださいまして、ありがとうございます。ただ読んでる途中まで理解してても、あれっ?って思えて、何度も読み返して、やっとこさ、うっすら理解できた程度です、すみません。 非常にお詳しい方のようですので、大変申し訳ないのですが、もう少しだけ質問したいことが出てくるかもしれないので、締め切りは少しおまちください。

その他の回答 (1)

  • proto
  • ベストアンサー率47% (366/775)
回答No.1

そのまま「平均値の差の検定」で検索したら参考になりそうなページが出てきましたよ。 http://aoki2.si.gunma-u.ac.jp/lecture/Average/t-test.html さて今回の場合、A群の平均値をXa,B群の平均値をXbとして、   Xa=Xb という仮説を立てて検定してみましょう。 検定する場合の考えは『平均値が等しければ、二群の平均の差を取れば0に近く成るはずだ』といった感じで行きます。 平均の他にも、それぞれの不偏分散をUa,Ub、それぞれの標本数をNa,Nbとしておきましょう。 今回は   Na=Nb=30 ですね。 また不偏分散を求めるときは、平均からの差の自乗の和を(標本数-1)で割ることに注意してくださいね。 さて、今回はt検定を使いたいので、A群とB群は両方正規分布に従い、母分散(真の分散)は等しいとしましょう。 もし母分散が等しくないかもと思ったら、等分散性の検定というのがあるので、分散が等しいかどうか検定してみてください。 母分散が等しく無ければt検定は使えません。その場合、Welch の方法による t 検定というのをやってみてください。 また分布が明らかに正規分布でない場合には、その分布に見合った検定をするか、または特別な分布を仮定しなくて済むノンパラメトリックな検定を試してください。 まぁ、とりあえずは気楽にt検定でやりましょう。 まずA群,B群をプールした(合わせた)分散をUとして計算します。   U = ((Na-1)Ua+(Nb-1)Ub)/(Na+Nb-2)    = (Ua+Ub)/2   (Na=Nbですからね) 次にUを用いて、統計量tを   T = |Xa-Xb|/√(U(1/Na+1/Nb)) で計算しましょう。 先ほども書いたように、平均が等しければXa-Xbは0に近いはずですから、このTも0に近い値になるはずですね。 さてこのようにして計算したTの値は自由度(Na+Nb-2)のt分布に従います。 ここで言う自由度とは、自由度が大きいほどt分布は正規分布に近づくし検定も正確になる、くらいに捉えておいてください。 一般的な価値観として、自由度は大きい方がいいです。 さてTの値が求まったので、t分布表を見て検定してみましょう。 http://aoki2.si.gunma-u.ac.jp/CGI-BIN/ttxp.html 表の縦の軸が自由度ν、横の軸が危険率αです。 αは検定結果を間違う率で、0.1だと10%くらいの確率で間違って、0.01だと1%の確率で間違うといった感じです。 普通は0.05を、シビアにやりたいなら0.01を使います。 今回、自由度(30+30-2)=58なので、表のν=40の段を見ましょうか。 ν=58の段があればいいのですが、無いのでしかたなく自由度を小さめに見積もります。 ちなみに対立仮説としてXa≠Xbを仮定するので両側検定です。 どちらかが大きいとかの検討がついていてXa>Xbみたいな対立仮説を立てるなら片側検定になります。 ν=40,α=0.05のときT<2.021、ですね。 これは、この条件でTの値は95%の確率で2.021より小さいと言うことです。 Tが2.021よりも大きければ、さてはXa=Xbじゃねぇな、と言うことでXa≠Xbと結論づけます。 Tが2.021よりも小さければ、Xa≠Xbとは言えないと言う結論に成ります。 α=0.01の場合は、ν=40,α=0.01の所を見て、T<2.704ですから。 この条件でTの値は99%の確率で2.704より小さいと言うことです。 後は先ほどと同様です。 これで、一応のところ検定は一通り出来るはずです。 統計の用語について知りたいとか、その他の場合にも検定したいとか思えば。 本1冊分くらいの内容になるので、専門の本を読みましょう。 不明な点がありましたら補足にでもどうぞ。

Life_is
質問者

お礼

さらに質問ですみません。仮に上記に私が記入した計算式が正しいと考えて、統計量tを計算したのですが、2.021よりも小さくなりました。 そこで、 「 Tが2.021よりも小さければ、Xa≠Xbとは言えないと言う結論に成ります。」 この意味がどうしてもはっきりわかりません。【Xa≠Xbとは言えない】と言っても【Xa=Xbと言える】とならないことは、知っているのですが、これは、つまりどういうことなんでしょうか?  かいつまんで言うと、限りなく【Xa=Xb】 だけど、ほんのちょっとだけ、Xa≠Xbっていう可能性もある、ということなんでしょうか? 本当にすみませんが、何卒、よろしくお願いします。

Life_is
質問者

補足

早速ありがとうございます。 いきなり質問ですが、以下の式の分母がわかりません。 T = |Xa-Xb|/√(U(1/Na+1/Nb)) 分散U = ((Na-1)Ua+(Nb-1)Ub)/(Na+Nb-2)は、計算できたのですが、このUの使い方がわかりません。ひょっとして、分母は、 U × (1/Na+1/Nb)の 平方根のことなんでしょうか? となると、Na=Nb=30なんで、U÷15ってことでしょうか?

関連するQ&A