- ベストアンサー
ゲノムシークエンスのcoverageとは
ゲノムシークエンスでよく5xとか 8x coverage という表記を目にするのですが、これは一体何を意味しているのでしょうか? どなたかご存じの方教えていただけると幸いです。あるいは説明のあるwebpageを教えていただいてもうれしいです。
- みんなの回答 (2)
- 専門家の回答
質問者が選んだベストアンサー
ゲノムの総配列数に対して、読んだ配列数の総和が何倍かということです。 ゲノム配列の決定は、近年ではいわゆるショットガンシークエンス法が主流です。ランダムなゲノムDNA断片を片っ端から読んで、数百~千塩基程度のバラバラの塩基配列データからコンピュータで配列のオーバーラップを見つけてパズルのようにつなげていきます。 仮に1 Gb (1,000,000,000 bp)のゲノムを、個々のデータ長が平均1000 bpのショットガンシークエンスしたとしましょう。ランダムなゲノム断片を読んで、1,000,000データ集めれば読んだ塩基数の総和はゲノムサイズに相当する1 Gbになります。これが1x coverageです。しかしこれでは、ランダムに配列を読んでいるし、オーバーラップもあるので、何度も繰り返し読まれている部分もあれば、一回しか読まれていない部分、全く読まれていない部分もでてきます。ゲノム全体を隙なく読み尽くすには、coverageを数倍から十数倍以上にする必要があります。何倍のcoverageでゲノム配列の解析を行ったかというのは、ゲノム配列データの完全性、正確性を判断する目安になります。
その他の回答 (1)
- Dr_Hyper
- ベストアンサー率41% (2483/6032)
理論上、何回その生物のゲノムを繰り返し読んだかの意味ですね。 coverageの回数が多いほど信用できる配列であるということになります。 もちろん読みづらいところや、繰り返し配列でちゃんとデーターがつながっていないところなど残されていると思いますが、coverageが記載してあれば信用性の目安になります。
お礼
信用性として理解すればいいのですね。回答ありがとうございました。
お礼
丁寧な説明ありがとうございます。よくわかりました。