- ベストアンサー
長さNヌクレオチドのDNAで、幾通りのヌクレオチド配列が可能か
長さNヌクレオチドのDNAで、幾通りのヌクレオチド配列が可能か。二本鎖の場合は何通りか。 この質問に、5塩基と4塩基のヌクレオチドを考えてみました。 5塩基だと、GGCTAとTAGCCは GGCAT CCGTA TAGCC ATCGG と、二通り出てきて、同一でありました。 したがって、1/2*4^Nと考えてみました。 (1/2は二組が二つとも同じなので、ひとつに考えるために決定。4~Nは4塩基(A,T,C,G)で並べると、4のN乗必要である、と考えました) 次に、4塩基の場合を考えて見ますと、 Aから始まる4つの塩基(ATGGなど)と残りのT,C,Gから始まる4つの塩基を同様にならべてみました。 すると、合計4の4乗つまり256通りの塩基配列ができました。 ここで、5つの塩基の時と同様、 ATCCとGGATは、同一の塩基 すなわち ATCC TAGG GGAT CCTA と出てくるので、1/2*4^Nと考えてみました。 すると、答えから、 ACGTのときは ACGT TGCA という組み合わせが考えられ 同様にTGCAのときは TGCA ACGT という組み合わせが考えられ、 最初の ACGT TGCA は180度回転させると一つの塩基配列の中で、まったく上下同様の塩基配列が現れることになりました。 つまり → ACGT TGCA ← というものは、180度回転させると、全く同じものなのです。 そこで疑問です。 この問題の回答に 奇数の塩基の数のときは 1/2*4^N 偶数の塩基の数の時には 1/2*4~N+1/2*4^(1/2)N と出てきたのですが、 1/2*4~N+1/2*4~(1/2)N の +1/2*4~(1/2)N のところが分かりません。 たぶん、 ACGT TGCA や CTAG GATC のようなものに関係する数式だと思います。 でも、理解できません。 教えてください。
- みんなの回答 (5)
- 専門家の回答
質問者が選んだベストアンサー
1) ATTT TAAA 2) TAAA ATTT 3) AAAT TTTA 4) TTTA AAAT 1)と3)は同一で配列Aとしましょう 2)と4)は同一で配列Bとしましょう ところがAとBは違う配列です。 なぜならDNA(RNAも)は配列に極性(のようなもの)があります。 5'ATTT3' 3'TAAA5' と書けばわかり易いと思います。ふつうDNAの配列を表記する時は、糖鎖の5'が露出している方から(左から右に)並べていきます。反対側がの3'が露出していることになります。しかし、それにくっつくしたの配列はDNA(RNAも)の性質上左が3'となります。 5'ATTT3' +鎖 3'TAAA5' -鎖 で、3'TAAA5' -鎖を上にして表記すると 5'AAAT3'になるわけです。これが1)と3)が一緒になる理由です。 でこれが2で割る理由です。奇数の場合は単純に2で割ればことがすむのですが、偶数の場合(完全な)パリンドロームが問題になります。これは2で割る必要がないので私の計算で先にこの数を求めて引いておいたわけです。 (完全な)パリンドロームは全長2nの時前半の半分n個の配列が決まるとおのずと後半が決まります。 例えば2n=8のばあい前半がATGGだと後半はCCATにならざる終えないわけです。 したがって(完全な)パリンドロームのかず4^nを求めて4^2nから引いたわけです。 たぶんこれでご質問の答えをフォローしていると思いますが、疑問があればおっしゃってください。返事は遅くなるかもしれませんが、いたします。
その他の回答 (4)
- Chicago243
- ベストアンサー率38% (401/1043)
付け加えておきます。 私が回転対称と申し上げたのは、属に言うかいもん構造(パリンドローム)のことです。 http://contest.genome.ad.jp/2004/problem3.html
お礼
丁寧な質問の答えを教えていただき、ありがとうございました。
補足
tRNAに見られるかいもん構造のことですね。どこかで読みました。 かいもん構造が、N個のヌクレオチドの数のうち、どれくらいをしめるかという問題で、難しい質問をしてしまいました。 この計算式も難しそうですね。 要するに、奇数個のヌクレオチドではありえない構造が、偶数ではありえるということですね。 そうして、かいもん構造は、ダブるという構造から、違う次元の考えをしなければならない、特徴的な回転対称をしているということですね。 ↑この考え方が、実際的には、現在の私の実力では考えにくいと思いましたが、Chicago243さんの考え方で、少し、明るくなったような気がします。 パソコンで画面に映し出して、「ここが、こうなって、回転構造だと、ダブるヌクレオチドから、数を考え直さなければならない。」とか、具体的な例を示すことが出来たらいいですね。 本当にありがとうございました。一応、友達にもいってみて、回答を考え直したいと思います。
- ga111
- ベストアンサー率26% (247/916)
最初にご指摘のように奇数でも回転対象構造はできますね。すべての私の意見を取り下げます。取り急ぎお詫び申しあげます。
お礼
いえいえ、同じ質問を一緒に考えてくださって、ありがとうございます(^^
- Chicago243
- ベストアンサー率38% (401/1043)
偶数の時回転対称が問題になるということですね。こう考えればいいのではないでしょうか? 全長2nの時例えば5'から半分nこが決まれば回転対称の配列がおのずときまりますよね。 すなわち4のn乗この回転対称のパターンがあるわけです。この回転対称を除いた配列では ATCC TAGG GGAT CCTA で示されているようにだぶるわけですね。 ですから、まず4の2n乗から回転対称の数だけ引いて置きましょう。 4^2n-4^n この引いたのこりが、2倍にだぶっているわけですから、 (4^2n-4^n)/2 回転対称の数を補うと (4^2n-4^n)/2+4^n (初めに述べたように2nが全長です)
お礼
本当に分かりやすい説明を有難うございました。
補足
Chicago243さん、ありがとうございます。 さて、質問なのですが、たとえば、 ATTT TAAA は、 TAAA ATTT と、同一と考えますよね…。 AAAT TTTA は、どうなるのでしょうか? TTTA AAAT と、同一に考えるのでしょうか? もし、Chicago243さんのように考えるなら、 ATTT TAAA は、 AAAT TTTA と、同一と考え、 TAAA ATTT は、 TTTA AAAT と、別に考えるのですか? いちおう、半分に計算してしまうのですが、 AGCT TCGA は、(ダブっている数を考え) TCGA AGCT と、同一と考え、やはり、半分に計算します。 しかし、 AGCTは、回転対称というのがあるんですね。 そうしたら、その数え方は、 AGCT AGCT (二倍にダブっているペア)> (回転対称) TCGA TCGA ということで、二倍にダブっているペアと回転対称のペアと別に考えるのですね。 ここでは、 AGCT は、”二倍にダブっているペア”と、”自分自身回転対称して、同じと考える『自家(自分自身の)ペア』”と考えるから、 回転対称は、 ある長さのヌクレオチドの数^a/2(a任意ここでは、Chicago243さんの言うように、2n、か、質問文のようにn)と考えると、いいということですね。 回転対称は2n個のヌクレオチドの半分が決まれば、残りのヌクレオチドは、4^n/2*1*1*1…(1の数は偶数個)という風に決まるのですね。 合っているでしょうか? よって、残りは、Chicago243さんのいうとおり、考えたらいいというわけですね。 一つ疑問だったのは、 ACGT は、自分で ACGT TGCA と並べると、回転したら同一だったということと、 ACGT TGCA は、 TGCA ACGT と、同一ではないかということ、つまり、紙に書いた ACGT TGCA と TGCA ACGT は、この二つの間の線で、下から上へと折りたたむと同じであるのじゃないだろうかという疑問です。 すると、回転対称の数も変わってきますよね…。 こういうことは考えないで、二次元で考えるのかなとふと考えました。(二次元なら、回転で理屈がつくからだと思うのです。三次元なら折りたたむと同一) ダブるという考えが、分かってないのかもしれません。 こういうのは、二次元の紙の上で考え、折りたたんだら同一とかそういう風には考えないのでしょうか?(そういう気もしますが…(^^;) 一応、ACGTに始まり、4^4つまり256個紙に書いて確かめてみました。 すると、回転対象は8個あり、計算式の当てはめ方は、ちょっと考えていますが、回答は得られました。 こういう計算は、事象から推定して、考えるというのは難しいので、Chicago243さんのように考えて見ますが、鵜呑みにすると、Chicago243さんの計算がもったいなく思えるので、疑問点をあげてみました。 回答を考えてくださって、ありがとうございます。 もう少し、回転対称という言葉を説明してください。 そうしたら、理解できるような気がします。 今日は本当にありがとうございました。伯父が急病したため、急遽出向いたため、返答が遅れてしまい、ご心配をお掛けしました。 丁寧な回答文、ありがとうございます。
- ga111
- ベストアンサー率26% (247/916)
むっずかし。 答え本当にあってますか? 回転対称構造ができるのは偶数のときのみですよね。そうすると、回転対称構造によって組み合わせの数がすくなくなるのは偶数のときじゃないでしょうか? すなわち AAGTT TTCAA は回転させても違う並びです。 よって偶数のとき (1/2)*4^n よって奇数のとき 4^n のような気がするんですが、、、自信はまったくありません。
お礼
一緒に質問を考えてくださり、有難うございました。
補足
ga111さん、ありがとうございます。 答えは記述のようになっているので、たぶん合っていると思うのです。 むずかしいですよね・・・(^^;)
お礼
質問の回答をありがとうございました。 一応質問の内容を締め切らせていただきます。 ありがとうございました。
補足
分かりました。 5'ATTT3' と、定義すると、 5'ATTT3' と 5'TTTA3' は、違うという意味ですね。 つまり、ATTTもTTTAも、紙に書いてみて、紙を折り曲げたからATTTもTTTAも同一という立体的な違いは、ないという意味ですね。 遺伝子が5’から3’に移動する『決まり』を私は見逃していたのかもしれません。 → 5'○△×□3' なら、 5'□×△○3' → は、異質というわけですね。 それで、回転対称の分は、数えて、重なることなく、すべて異なったものとして、数えることが出来ることがわかりました。 つまり、問題文では、 AGCT ACGT TGCA TCGA CATG CTAG GATC CTAG は、 5'AGCT3' 3'TCGA5' 5'ACGT3' 3'TGCA5' 5'TGCA3' 3'ACGT5' 5'TCGA3' 3'AGCT5' 5'CATG3' 3'GTAC5' 5'CTAG3' 3'GATC5' 5'GATC3' 3'CTAG5' 5'GTAC3' 3'CATG5' となり、別々のものとして8個取り出せるわけですね。 もし、極性がなければ、また、別の数式がでてくるということですね。 ありがとうございました。 こう、極性のところまで確実に数式で出てくるというのが、不思議でたまりません。 うまくなっているものですね。どういう性質を選び出して、こう、数式に当てはめるのでしょうか。まだまだ私も未熟者です。本当にありがとうございました。 また、考えてみます。