- ベストアンサー
PCRとシークエンスエラーについて
DNAの塩基配列のエラーはどのような時に起こるんでしょうか? サブクローニングでは起きないみたいですが。 また、PCR後にシークエンスは必ず行うものなのでしょうか? 経験上PCR後のシークエンスでのエラーは両端に多いと思うのですが、 きのせいでしょうか? いつも両端が合っていることを確認してそれから中を読むようにしています。 また、1つのプライマーで300塩基読めますが、 複数使うプライマーの場合解析が大変じゃないですか?
- みんなの回答 (5)
- 専門家の回答
質問者が選んだベストアンサー
- ベストアンサー
3100、高いですよ。確か4000万ほどするはずです。まあこういうものの定価はあってないようなものなので、実際に備品購入する場合にどれだけになるかはその時々ですが。 なんにせよ、1検体3500円で外注に出せるとしたら・・・ >クラスター解析とは何ですか? >同じプライマーでシークエンスを70種類もやる意味ってあるんですか? あちこちから分離されたウイルスの同じ部位(同じプライマー)の塩基配列を比較して疫学解析などをやったりするわけです。 クラスター解析とは、そのための手法です。分子系統樹を描いて「この株とこの株は遺伝的に近いがこれとは遠い」とか推測したりするわけです。 アライメントとは、複数の塩基配列を並べて「位置合わせ」をすることです。 例えば、AGGCGTTGCATAGACCGTAGAACCGG という配列と、TTGCATAGAGCCGTAGAAという配列がある場合、 AGGCGTTGCATAGACC.GTAGAACCGG -----***********.******---- TTGCATAGAGCCGTAGAA となるわけです。ま、同じプライマーを使った複数配列を合わせるだけならソフトを使うまでもないことが多いのですが、データベースにある長い配列とPCR産物からシークエンスした短い配列を合わせようとすると、ソフトが必要になることが多いですね。 ソフトとwebサイトを仕事の手順を追って紹介すると・・・ まず波形ファイル(ab1)を表示、編集するソフトで Chromas というのがあります。 http://www.technelysium.com.au/ 波形のComplementや、配列を検索してそのポジションにジャンプしたり、といった基本的な機能しかありませんが、シークエンスデータのチェックには必要にして十分です。 配列が決定したら、それが確かに狙った産物かどうか確認するわけですが、それは Blastを使います。 http://www.ddbj.nig.ac.jp/search/blast-j.html ここに配列を放り込んで検索すると、データベースからマッチする配列を表示してくれます。それもアライメントまで取った状態で結果を返してくれるので、GENETYXを使う機会が激減しました。 で、塩基配列の正体が判れば、同一プライマーでたくさん取った遺伝子の配列の比較解析(クラスター解析)をするわけですが、これはClustalWを使います。 http://www.ddbj.nig.ac.jp/search/clustalw-j.html ここに複数の配列を入れるとNJ法などでクラスター解析をしてくれて結果を返してくれるわけです。 返ってきたデータはテキストデータなのですが、そのままではさっぱり判りませんので(昔勉強したけど忘れてしまいました)、TreeViewというソフトに系統樹を描いてもらいます。 http://taxonomy.zoology.gla.ac.uk/rod/treeview.html あとは考察するのみ・・・と。 まあ私のやっている仕事では、これで大半の仕事が済んでしまうので、GENETYXは最近ほとんど使わないですね。
その他の回答 (4)
ABI 3100はポピュラー(というわりにバカ高いが)な機種ですものね。 >特に5つくらいプライマーを使うの解析に1日くらい時間がかかってしまいます。 それはデータをコレクトしてからの解析にということですか? 私は出てきたデータの扱いは最初からある程度決まっているような解析しかしたことがないので、そこまで時間をかけたことはないです。 70本のシークエンス(同一のプライマー)を確定させるのに3日、解析(ホモロジー解析とクラスター解析)に1週間とか、そんな程度ですね。 >波形ファイルしかとらない人は波形から配列をひとつひとつ入力しているんでしょうかね。 波形ファイルを読み込んでシークエンスと一緒にFとRを並列表示してくれ(もちろんRはComplementして)、ミスマッチ部分を指示してくれるソフトがあります。欲しいっ!と思いましたがもちろん高くて買えません。 フリーソフトとGENETYX(しかもかなり旧いバージョン)を組み合わせて使っています。 とはいうものの、最近はwebでほとんどできてしまうので、GENETYXを使う機会がどんどん減っています。波形表示ソフト(フリーソフトであります)さえあれば用が済むようになってきました。(その程度の仕事しかしていないというのもありますが) >2500bpの塩基は一回の実験で終わりましたか? その時はABIではない機械を使ったので、Dye-Primer法でした。キャビラリーでもない機種だったし。 なのでその時はかなり手こずりました。とはいうものの実験自体は3日で終わりましたが。 シークエンスを繋げるのは、GENETYXでも他のソフトやwebでも、アライメントを取れば綺麗に繋がる場合もありますが、繋がらなくても「繋がる位置」は自分で設計したプライマーなので当然判っています。 なのでテキストエディターでしこしこやっても半日もあればお釣りが来ます。 >既知の配列なら300塩基ごとにプライマーを設計した方が早いと思うんですが。 もちろん既知ならそうですが、未知の長い配列を読むにはウォーキング法はなかなか良い方法だと思います。ちょっと時間がかかりますが。 外注ですが、私が頼んでいるところは3,500円/runです。なのでFR読めば7000円ということに。 例えば2本読みたい、というような場合、他の研究室の使用予定との兼ね合いもあったりして、予定をやりくりしている時間があったら外注に出した方が早い、ということもあります。 絶対的には自分でやった方が安いのですが、実験する頻度と検体数によっては安く済むことも多々あると思います。 外注に出すと、検体が向こうに到着した日から2営業日でデータが返ってきます。宅急便で届くのに2日ほどかかるので、普通は出してから3~4日というところです。 価格や早さは業者によっていろいろだと思いますが。
お礼
御回答有り難うございます。 ABI3100は馬鹿高いのですか? 機械、試薬が高いのですか? 確かに解析自体は半日あれば終わるのですが、 実験をしながらではなかなか確保できないことがあるんです。 一つでもエラーがあったら終わりなので結構神経を使う仕事です。 クラスター解析とは何ですか? 同じプライマーでシークエンスを70種類もやる意味ってあるんですか? 解析用のフリーソフトとWEBでできるそうですが、 良かったら何を使っているか教えて頂けないでしょうか? アライメントとは配列のことですか? 3,500円/runのようですが、 7つのプライマーを使えば24500円ですね。 ABIの装置を使ってやるより安いんでしょうかね。 具体的な値段を知らないのであまり高いという認識がないんですが。 DNAとプライマーはどうやって送るのですか? 4℃で送るんでしょうか? 長くなってスイマセン。
忘れてました。 >ショットガン法って何ですか? これは長くて未知の配列のDNA鎖を読むとき、適当な制限酵素でDNAを切り、その産物を1つ1つシークエンスしていく手法です。 配列が判っていませんので、もちろんゲルからPCR産物を切り出してDNAを抽出し、サブクローニングしてシークエンスすることになります。 そうやってバラバラに読んだ配列は、その繋がり方も未知ですので解析にそれなりに手間がかかるというわけです。私はやったことがないので判りませんが、そのためのソフトもあるそうです。 (私はウイルス屋なので、そんな長いのは相手にしたことがないんです) それから未知のDNAを相手にする別の方法で、ウォーキング法というのもあります。 これは最初に1カ所プライマーを設定して、それでとりあえずFowardだけ読み、出てきた配列からまた適当な位置にプライマーを設計してシークエンスする、また出てきた配列からプライマーを設計し・・・という具合にだんだんプライマーを3'側に設定していく方法です。 プライマーを設計して発注し、何回もシークエンスを実施する分、手間暇はかかりますが、やはり"繋がり方"は判っているので後の解析は楽です。 余談ですが、今ではシークエンスも外注に出した方が安いくらいなのですが、「ウォーキング法」として注文するとまだまだ目の玉が飛び出るほど取られます。 でも、返ってきた配列から素早く次のプライマーを設計して追加解析を発注する、という「勝手にウォーキング法」をやると、普通のシークエンス代×回数で済むのでお得です。 ただ、私が利用している業者は、「追加解析は3日以内に発注すること」ということなので、忙しいですが・・・
お礼
御回答有り難うございます。 シークエンスは外注した方が安いんですか? 装置があってもですか?
補足
ウォーキング方もいいですけど、 既知の配列なら300塩基ごとにプライマーを設計した方が早いと思うんですが。 外注の場合はDNAを送れば結果はどれくらいで帰ってくるんですか?
No.1です。 >エラーではなく読めていないのです。 "読めていない"と"エラー"の言葉の定義が私と相談者さんで違うかもしれないのですが・・・ 私はここでは"エラー"を"."という意味で使っています。すなわち、ForwardとReverseの塩基が一致しないという意味です。これは相談者さんも言われるとおり、両端で多くなります。("."という表記はたまたま私が使っているGENETYXがそうであるというだけの話ですが) "読めていない"は、"N"です。つまりソフトが「判定不可能」と返した場合のことです。 これ、ABIの3100の話なので、機種が違えばリザルトの返し方も違うでしょうけど。 そういう意味では、読み始めといえど"N"が多く出てくることはまずありません。 >コンピュータが波形を読んでいるので勝手に修正するのは不味いと思うんですが。 実際にはこれをやらないとシークエンスデータは完成しませんよね。 何もしなくてもForwardとReverseのシークエンスが完全に一致することなんてほとんどありませんから。 例えば、 Foward : ATTCTTAGGCCGTAGCTG *.****..*.*........ Reverse : ACTCTTTAGGCCGTAGCTG という配列が出てきたとします。 するとFowardとReverseの波形データを見比べて、Fowardの読み始めの波形が不安定で、次のTのピークの立ち上がりにCのピークが隠されてしまってTと読んでしまった・・ということが読みとれれば、この2塩基目はCでしょう。 また、ReverseでTのピークが実際は2つのはずなのに、何故かソフトは3つと読んでしまっている、ということが判れば、5-7番目のTTTはTTというように修正できます。 で、この2カ所を修正すればFowardとReverseのシークエンスは100%一致します。これをこのDNAのシークエンスとして決めるというわけです。 シークエンサにかけて返ってきたシークエンスデータは、波形を丹念に読むと「なんでこんなところを拾うかな?」とか「ここ、ピークあるのに読んでない」とか言う場所がけっこうあります。ですので、少なくとも数カ所の修正は必須です。 例えばABIの3100だと、波形データ(ab1ファイル)とそれからソフトが判定したシークエンスデータ(テキストファイル)が出力されますが、テキストを取らずに波形ファイルだけを回収する人もいるくらいです。 >2100塩基の場合、一つのプライマーで300塩基読めるとすれば >7つのシークエンス波形を照合しないといけないですよね。 よく使うのはABIの3100ですが、だいたい500bpくらいは安定して読めています。 最近2500bpくらいある遺伝子を読んだのですが、プライマーは5カ所に設定しただけで綺麗に読めました。 また、こういう自分でプライマーを設計して読む場合は、位置が最初から判っているので繋ぐのも楽です。
お礼
私も同じ物を使っています。 FとRの両端は安定しないですよね。 どちらかで補完するというわけですね。 Nがたくさん出るような汚い波形の場合はシークエンスを やり直した方がいいんでしょうか? ABI3100って500bpくらい読めます。 最初の方は安定しないので波形が怪しいと思うのですが、 50bpくらいまでいかないと波形が信用できなくないですか? 2500bpの塩基は一回の実験で終わりましたか? 波形が綺麗に読めないとやり直しということもあると思いますが。 解析はどれくらい時間がかかるものなんですか? GENETYXに複数のプライマーの結果を繋ぐ機能はあるんですか? GENETYX ATSQというのはご存じですか? 長文になってスイマセン。
補足
確かに読み始めにNはあまり出ていませんね。 しかし、波形は安定していません。 シークエンスの解析に時間がかかるのですが、 これは慣れですかね。 特に5つくらいプライマーを使うの解析に1日くらい時間がかかってしまいます。 細かくやりすぎているんでしょうかね。 しかし、一塩基でも間違っているといけないのである程度 の細かさは必要ですし、難しいところですね。 波形ファイルしかとらない人は波形から配列をひとつひとつ入力しているんでしょうかね。
1.「DNAの塩基配列のエラー」ですが、質問の意味がよく判りません。 自然界でのことなのか、PCRやシークエンスなどの実験上でのことなのか・・・「サブクローニングでは」と書かれていることから実験上のことだとは思うのですが。 2.PCR後にシークエンスは必ず行うものなのでしょうか? これについては「目的により」というところです。標的遺伝子や病原体のスクリーニング等では、標的サイズの産物が増幅されたのを目視しただけで用が足りますし、他に手法が無く確定的な診断をしたい場合などは、当然PCR産物をシークエンスすることになるでしょう。 3.シークエンスエラーは、正確には「両端」ではなく「読み始めの位置」に多い、ということだと思いますが? 「PCR後のシークエンス」というのはおそらくダイレクトシークエンスのことを指しているのだと思いますが(PCR産物をサブクローニングしてシークエンスすることもできますよね)、どういう手法にしろ読み始めはシグナルのピークが高く"混雑"しているので、結果として読み違いすなわち「エラー」が増えます。 普通は1つのPCR産物をForward PrimerとReverse Primerを使って両側読んでいるでしょうから、データコレクト後にReverseの方をReverse Complementして2つの配列でアライメントを取ると、最初と最後すなわち「両端」でミスマッチが多い、ということになります。 まあそれはシークエンスの原理からして当然の現象なので、ミスマッチの部分を波形を見ながら修正して合わせれば良いだけ、なんですけどね。程度問題ではありますが。 4.また、1つのプライマーで300塩基読めますが、 複数使うプライマーの場合解析が大変じゃないですか? これも質問の意味がちょっとよく判りません。 PCR産物をダイレクトシークエンスで読む限りは、設計したプライマーの位置も産物のサイズも最初から判っているので、基本的には出てきたデータを繋げるだけで済むはずです。 ショットガン法とかの場合は確かにそれなりに解析は大変ですが。
お礼
御回答有り難うございます。 cDNAをPCRでタグなどを付けた場合、 両端がエラーが多いかということを質問したつもりなんですけど。 シークエンスの読み始めは波形が安定しないので ちゃんと読めていないことが多いですね。 エラーではなく読めていないのです。 ミスマッチの部分を波形を見ながら修正するとはどういうことですか? コンピュータが波形を読んでいるので勝手に修正するのは不味いと思うんですが。 4についてですが、 長いDNAのシークエンスを確認するのが結構大変じゃないかということです。 シークエンスがちゃんとよめていればいいですが。 2100塩基の場合、一つのプライマーで300塩基読めるとすれば 7つのシークエンス波形を照合しないといけないですよね。 それが大変だなと思ったのですけど。 慣れなのですかね。 ショットガン法って何ですか?
お礼
GENETYXはいくらか知りませんが、 かなり高そうですね。 既知の配列でシークエンスファイルがある場合もこの方法はつかえそうですね。 アライメントはPCがやらないと人が配列を探してやっていると日がくれそうですね。昔は人間がやっていたのでしょうか? PCの普及とシークエンス関係は切っても切れない関係ですかね? データベースはみたことがないのですが、 私の扱っている物もそこに載っているんですかね。