長さNヌクレオチドのDNAで、幾通りのヌクレオチド配列が可能か
長さNヌクレオチドのDNAで、幾通りのヌクレオチド配列が可能か。二本鎖の場合は何通りか。
この質問に、5塩基と4塩基のヌクレオチドを考えてみました。
5塩基だと、GGCTAとTAGCCは
GGCAT
CCGTA
TAGCC
ATCGG
と、二通り出てきて、同一でありました。
したがって、1/2*4^Nと考えてみました。
(1/2は二組が二つとも同じなので、ひとつに考えるために決定。4~Nは4塩基(A,T,C,G)で並べると、4のN乗必要である、と考えました)
次に、4塩基の場合を考えて見ますと、
Aから始まる4つの塩基(ATGGなど)と残りのT,C,Gから始まる4つの塩基を同様にならべてみました。
すると、合計4の4乗つまり256通りの塩基配列ができました。
ここで、5つの塩基の時と同様、
ATCCとGGATは、同一の塩基
すなわち
ATCC
TAGG
GGAT
CCTA
と出てくるので、1/2*4^Nと考えてみました。
すると、答えから、
ACGTのときは
ACGT
TGCA
という組み合わせが考えられ
同様にTGCAのときは
TGCA
ACGT
という組み合わせが考えられ、
最初の
ACGT
TGCA
は180度回転させると一つの塩基配列の中で、まったく上下同様の塩基配列が現れることになりました。
つまり
→
ACGT
TGCA
←
というものは、180度回転させると、全く同じものなのです。
そこで疑問です。
この問題の回答に
奇数の塩基の数のときは
1/2*4^N
偶数の塩基の数の時には
1/2*4~N+1/2*4^(1/2)N
と出てきたのですが、
1/2*4~N+1/2*4~(1/2)N
の
+1/2*4~(1/2)N
のところが分かりません。
たぶん、
ACGT
TGCA
や
CTAG
GATC
のようなものに関係する数式だと思います。
でも、理解できません。
教えてください。