• ベストアンサー

統計に関する質問です。シロウトなので全く理解できません。

私は大学で遺伝子関係の研究室に在籍しています。 その研究室で先輩に 「Hardy-weinberg平衡において、予測値と実測値の比較はどういう方法でやればよいか調べておいて。」 と言われ途方にくれています。  知っている方にとってはなんでもない問題なのかもしれませんが、統計に関しては全くのシロウトでなにもわかりません。  ご存知の方がいらしたら、アドバイスをお願い致します。

質問者が選んだベストアンサー

  • ベストアンサー
  • stomachman
  • ベストアンサー率57% (1014/1775)
回答No.1

「ご存知」じゃないですが。 つーか、こういうものは知ってるかどうかではないんですけど。という説教はさておき、アドバイスです。 一番簡単なHardy-weinberg平衡つったら、一つの遺伝子座に2通りのアレルがあって、一方が優性、他方が劣性、つまりAとaがあるという場合でしょう。 個体がAAを持つ確率、Aaを持つ確率、aaを持つ確率をそれぞれP(AA,0),P(Aa,0),P(aa,0)と書くことにしましょう。二つ目の添え字である0は第ゼロ世代、という意味です。確率ですからP(AA,0)+P(Aa,0)+P(aa,0)=1です。 この状態に於いて、 仮定1) AA, Aa, aaのどれであっても子孫の数には影響しない。 仮定2) A,aのどちらも同じ確率で子孫に伝わり、優劣はない。 仮定3) 完全にランダムに交配される。空間的に偏ったり閉鎖集団を作ったりしない。 仮定4) 個体数は充分多い。 という条件下で交配すると、世代が1回代わっただけで平衡状態に達してしまいます。つまり、その次の世代から後は、P(AA,m),P(Aa,m),P(aa,m)はmによらず一定値になってしまう。これがHardy-weinberg平衡です(と思います。良くは知りません。) p(A)=P(AA,0)+P(Aa,0)/2 p(a)=P(aa,0)+P(Aa,0)/2 と書くことにすると、p(A)+p(a)=1であって、 P(AA,m)=(p(A))^2 P(Aa,m)=2p(A)p(a) P(aa,m)=(p(a))^2 である。(そして、P(AA,m)+P(Aa,m)+P(aa,m)=1) 第m世代から第m+1世代にどのように遺伝子が伝わるかを計算してみると、なんでそうなるか分かります。 AAが生じるのは、 ♂=AA, ♀=AAであるとき、確率1 ♂=Aa, ♀=AAであるとき、確率1/2 ♂=AA, ♀=Aaであるとき、確率1/2 ♂=Aa, ♀=Aaであるとき、確率1/4 それ以外のとき、確率0 ですね。だから P(AA,m+1)=P(AA,m)P(AA,m)+P(Aa,m)P(AA,m)/2+P(AA,m)P(Aa,m)/2+P(Aa,m)P(Aa,m)/4 =(P(AA,m)+P(Aa,m)/2)^2=(p(A))^2 です。同様にして、 P(aa,m+1)=(P(aa,m)+P(Aa,m)/2)^2=(p(a))^2 そして、 P(Aa,m+1)=1-P(AA,m+1)-P(aa,m+1)=2p(A)p(a) で、実測値がこの理想状態からずれてくるのを、どうやって評価するか、ってのがご質問でした。これはつまり、「上記の仮定が成り立っているかどうか」を検定する問題なんです。 上記の計算の結果を見ますと、親の世代に含まれているAとaの頻度(p(A)とp(a))だけで話が決まっていることが分かります。だから、要するにこういう問題と同じです: 問題X:「Aと書いたカードとaと書いたカードが沢山入った箱がある。Aと書いたカードの枚数は全体の枚数のp(A)倍であり、残りはaと書いたカードである。 さて、この箱から2枚のカードをランダムに取って、それがAAなのかAaなのかaaなのかを記録し、取ったカードを箱に戻す、という操作する。この操作をN回繰り返した時、AAだった操作の頻度、Aaだった操作の頻度、aaだった操作の頻度、はそれぞれどんな分布に従うか。」  この問題の答を使って、以下のように検定ができます。 「仮定1~4が成り立っている」という帰無仮説を立てます。帰無仮説を前提にすれば、「どのような頻度がどのような確率で実測されるか」を予測する式が導けます。(それこそが、問題Xの答です。)  これを実測結果に当て嵌めてみる。  もしそういう実測結果が得られる可能性がとんでもなく低いと計算されるようでしたら、すなわち帰無仮説は誤っているに違いありません。だから、「上記の仮定が成り立っていない」という結論が言えます。  もしそういう実測結果が得られる可能性がとんでもなく低い訳ではない、と計算されるようでしたら、すなわち帰無仮説は誤っているとは限らないことになります。だから、「上記の仮定が成り立っているともいないとも分からない」ということになります。

kensuke2003
質問者

お礼

 stomachman様、丁寧な回答本当にありがとうございます。”アドバイスです”と書いてありましたが、これでほぼ完璧だと思います。  とても助かりました。どうもありがとうございました。