• ベストアンサー

ゲノムシークエンスのcoverageとは

ゲノムシークエンスでよく5xとか 8x coverage という表記を目にするのですが、これは一体何を意味しているのでしょうか? どなたかご存じの方教えていただけると幸いです。あるいは説明のあるwebpageを教えていただいてもうれしいです。

質問者が選んだベストアンサー

  • ベストアンサー
  • Mr_Spock
  • ベストアンサー率75% (57/76)
回答No.1

ゲノムの総配列数に対して、読んだ配列数の総和が何倍かということです。 ゲノム配列の決定は、近年ではいわゆるショットガンシークエンス法が主流です。ランダムなゲノムDNA断片を片っ端から読んで、数百~千塩基程度のバラバラの塩基配列データからコンピュータで配列のオーバーラップを見つけてパズルのようにつなげていきます。 仮に1 Gb (1,000,000,000 bp)のゲノムを、個々のデータ長が平均1000 bpのショットガンシークエンスしたとしましょう。ランダムなゲノム断片を読んで、1,000,000データ集めれば読んだ塩基数の総和はゲノムサイズに相当する1 Gbになります。これが1x coverageです。しかしこれでは、ランダムに配列を読んでいるし、オーバーラップもあるので、何度も繰り返し読まれている部分もあれば、一回しか読まれていない部分、全く読まれていない部分もでてきます。ゲノム全体を隙なく読み尽くすには、coverageを数倍から十数倍以上にする必要があります。何倍のcoverageでゲノム配列の解析を行ったかというのは、ゲノム配列データの完全性、正確性を判断する目安になります。

eja10
質問者

お礼

丁寧な説明ありがとうございます。よくわかりました。

その他の回答 (1)

  • Dr_Hyper
  • ベストアンサー率41% (2483/6032)
回答No.2

理論上、何回その生物のゲノムを繰り返し読んだかの意味ですね。 coverageの回数が多いほど信用できる配列であるということになります。 もちろん読みづらいところや、繰り返し配列でちゃんとデーターがつながっていないところなど残されていると思いますが、coverageが記載してあれば信用性の目安になります。

eja10
質問者

お礼

信用性として理解すればいいのですね。回答ありがとうございました。

関連するQ&A