• ベストアンサー

どんな検定をすればいいか分かりません。

卒業論文で、鶏の精子数の増減を調べています。 一応データは揃ったのですがそれを分析する統計的処理が知識がないために出来ません。実験前後で精子数が有意に増えたかどうかを証明する検定はどのようなものでしょうか。また、おかしい数値を抜き出す棄却検定というのがあるそうですがそれはどのようにやるのですか。それらはエクセルでも出来るのでしょうか。教えてください。

質問者が選んだベストアンサー

  • ベストアンサー
  • stomachman
  • ベストアンサー率57% (1014/1775)
回答No.2

 月齢の揃った健康な雄鶏群からランダムに選んだ雄鶏たち(対照群)に通常の餌を与え、残りの雄鶏たち(実験群)にはネット通販で買ったトリアグラを同じ餌に混ぜて1週間喰わせ続けておいた。 そして雄鶏の精子の数を調べたところ、対照群ではX[i] (i=1,2,…, N)、実験群ではY[i] (i=1,2,…, M)であった。 というような話でしょうか。  対照実験をしないと、精子数の変化がトリアグラのせいなのか、他の要因のせいなのか、分からなくなります。例えば同じ雄鶏群についてトリアグラを喰わせる前後での比較をやったりすると、その間に雄鶏が加齢したために精子数が変化するとか、気象条件の違い、ケージの場所が変わった、夜中に暴走族がうるさかった、多くの雄鶏がナイスバディの雌鶏のファンになっただとか、その他いろんな要因が影響する可能性がある。  さて、 「おかしい数値を除く」ということができるためには、「おかしくない数値は、ある具体的に分かっている分布に従う」と確かに言えることが必要です。つまり、予め(トリアグラなしで)沢山のデータを取って、分布を調べておく必要がある。そうでない限り、「出したい結論にとって都合の悪い数値を勝手に捨てるというイカサマだ」と批判されてもしょうがない。最近はイカサマ論文が社会問題にまでなっていますから、要注意です。  また近頃は(すなわち、FDAが認めて以来)、薬の効果の有無はデータが少なくて済むベイズ統計を使って(つまり、ある追加の仮定のもとで)検定することが多くなってますけれど、それは苦し紛れ用としてとっておいて、まずはフツーにF検定でやってみましょう。必要なのはF分布表だけです。(なお「xが自由度nのt分布に従うならば、 x^2は自由度(1,n)のF分布に従う」という関係があるので、大抵のt検定はF検定と同じようなものです。) Step 0. NやMが十分大きい場合には、はじめに H0: 「雄鶏の出す精子の数は正規分布に従う」 という仮定が棄却できちゃったりしないかどうかを検定してみるのが本筋でしょう。でもま、実際にはそこまでやることは多くないんで、データがごく少なければ「H0を仮定する」と天下りに宣言してしまう。沢山データがあるときもヒストグラムを描いて見せる程度でお茶を濁すのが大抵です。だからこれは飛ばして、H0が成り立つという仮定のもとで次に進みます。 Step 1. 母集団の分散に差がないかどうかを検定します。 Xの方の標本平均を bx, 標本の分散をsx^2, 標本による母分散の不偏推定量を ux^2 = (sx^2)N/(N-1) Yの方の標本平均を by, 標本の分散をsy^2, 標本による母分散の不偏推定量を uy^2 = (sx^2)M/(M-1) とする。それぞれの母分散をσx^2, σy^2 とし、帰無仮説を H1: 「σx^2 = σy^2」 とする。H1(とH0)の仮定のもとでは、 a = ux^2/uy^2 は自由度が(N-1, M-1)のF分布に従う。  もしaがF分布の(例えば)5%点以上であれば、H1は95%以上の確からしさで棄却され、「トリアグラを喰わせた群は、対照群に比べて精子数のばらつきが有意に大きい」と言えますし、aがF分布の(例えば)95%点以下であれば、H1は95%以上の確からしさで棄却され、「トリアグラを喰わせた群は、対照群に比べて精子数のばらつきが有意に小さい」と言えます。いずれにせよ、もし棄却できたら、「トリアグラを喰わせるかどうかで、精子数のばらつきが有意に違う」という結論になり、Step2以下は適用できません。  一方、H1が棄却できなかった場合には「ux^2とuy^2はH1が棄却できない程度に似ている」とだけ分かります。  なお、xが自由度(A,B)のF分布に従うとき、1/xは自由度(B,A)のF分布に従います。だから、自由度(A,B)のF分布の95%点 = 1/(自由度(B,A)のF分布の5%点) Step 2. 「ux^2とuy^2はH1が棄却できない程度に似ている」場合に、H1が成り立つ事を前提にして、母集団の平均に差がないかどうかを検定します。(以下、Step1でH1が棄却できなかった場合の話です。) Xの方の母平均を mx Yの方の母平均を my とするとき、(もしH0とH1が正しければ) c = (((bx-mx-by+my)^2) (N+M-2) / ((1/N+1/M)(N(sx^2)+M(sy^2))) は自由度(1, N+M-2)のF分布に従う。  そこで、 H2(v):「my - mx = v」 という帰無仮説を考えると、この仮説(とH0とH1)のもとでは c(v) = ((bx-by-v)^2) (N+M-2) / ((1/N+1/M)(N(sx^2)+M(sy^2))) が自由度(1, N+M-2)のF分布に従う。  もしc(0)がF分布の95%点以下であれば、H2(0)は95%以上の確からしさで棄却され、「トリアグラを喰わせた群は、対照群に比べて平均が少ない」と言えます。また、c(0)がF分布の(例えば)5%点以上であれば、H2(0)は95%以上の確からしさで棄却され、「トリアグラを喰わせた群は、対照群に比べて平均が多い」と言えます。 Step 3. H2(0)が棄却できてもできなくても、H2(v)が95%以上の確からしさで棄却されるぎりぎりのv、というものが計算できます。つまり、c(v)がF分布の5%点に一致するようなv(これをV1とする)、c(v)がF分布の95%点に一致するようなv(これをV2とする)の二つです。H2(V1)とH2(V2)はどちらも95%以上の確からしさで棄却される。すなわち、95%以上の確からしさで「トリアグラを喰わせた群は、対照群に比べて平均がV1以上大きかったり、(-V2)以上小さかったりはしない」というのが結論です。

tenjinsan
質問者

お礼

回答ありがとうございます。 返信が遅くなって申し訳ありません。 (ちょっと所用で海外に行っていました。田舎でインターネット環境が整ってないところでしたので・・。) 本当に詳細な回答で感謝感激です!! 実験内容はstomachmanさんがされている感じのものです。統計は本当に難しいです。一応、理系で基本的な統計の勉強をしたのですが全く・・。今回教えていただいた方法で分析させていただきます。また、問題が発生した時は、助言をよろしくお願いします。

その他の回答 (1)

  • ssmarugoo
  • ベストアンサー率47% (84/176)
回答No.1

用いた鶉のサンプルサイズ(標本数)はどれくらいでしょうか? これが、多いのなら正規分布をすると仮定することができます。 そして、実験前後に有意に増えたか?を知りたいのなら、t検定が妥当だと思います。 対応のある2群のt検定です。 これで、母集団の差があるかどうかをみることができます。 有意に増えたいう仮説なら、片側検定ですね。 エクセルではやれません。論文にエクセルを用いてはいけません。計算の桁数が15桁までしかできないし、式自体もまちがっていることがあるようですから。 おかしい数値?は、除外していいと思いますよ。

tenjinsan
質問者

お礼

回答ありがとうございます。 御礼が遅くなって申し訳ありません。 エクセルは使えないのですか。。それだと、どこからか計算式を引っ張り出してこなくてはいけないということですね。頑張って分析進めていきたいと思います。 ありがとうございました!!!

関連するQ&A