- 締切済み
Ensemblのデータ
Ensemblのたんぱく質のデータはDNAより6通りの読み枠で考えて、実際に遺伝子として一個のタンパク質をコードしている読み枠(ORF)のものだけ集めたものですか? Ensembl(http://www.ensembl.org/index.html)のBIOMARTからさまざまな生物種の塩基配列やたんぱく質のデータがダウンロードできます。DNAは2本鎖ですので、実際に蛋白質の情報が格納されているのは、相補的な逆鎖の可能性もあります。その場合にも、3通りの読み枠が考えられますから、方向が正しいと言う情報が無い限り、合計6通りの読み枠が考えられます。ながながとなりましたが、どうぞ宜しくお願いいたします。
- みんなの回答 (2)
- 専門家の回答
みんなの回答
- sevenless
- ベストアンサー率66% (374/561)
> 6通りの読み枠で考えて、実際に遺伝子として一個のタンパク質をコードしている読み枠(ORF)のものだけ集めているのですかねぇ。 多分違います。記述を読む限り、既に蛋白になることが分かっている cDNA(ゲノム DNA ではありません) から ORF を読み取り、ゲノム上でその ORF に合う部分を探し出しているのです。
- sevenless
- ベストアンサー率66% (374/561)
Prediction Method として、 Genes were annotated by the Ensembl automatic analysis pipeline using either a GeneWise/Exonerate model from a database protein or a set of aligned cDNAs followed by an ORF prediction. GeneWise/Exonerate models are further combined with available aligned cDNAs to annotate UTRs (For more information see V.Curwen et al., Genome Res. 2004 14:942-50) と書いてあります。蛋白や cDNA のデータを元に遺伝子の場所を決めています。
補足
早速のご回答どうもありがとうございました。論文を詳しく見てみないとわからないかもしれませんが、Ensemblで使われたアルゴリズムは6通りの読み枠で考えて、実際に遺伝子として一個のタンパク質をコードしている読み枠(ORF)のものだけ集めているのですかねぇ。このように考えて正しいですか?
お礼
再度、ありがとうございました。なるほど!わかりやすい ご説明ありがとうございます。助かります。