• 締切済み

Ensemblのデータ

Ensemblのたんぱく質のデータはDNAより6通りの読み枠で考えて、実際に遺伝子として一個のタンパク質をコードしている読み枠(ORF)のものだけ集めたものですか? Ensembl(http://www.ensembl.org/index.html)のBIOMARTからさまざまな生物種の塩基配列やたんぱく質のデータがダウンロードできます。DNAは2本鎖ですので、実際に蛋白質の情報が格納されているのは、相補的な逆鎖の可能性もあります。その場合にも、3通りの読み枠が考えられますから、方向が正しいと言う情報が無い限り、合計6通りの読み枠が考えられます。ながながとなりましたが、どうぞ宜しくお願いいたします。

みんなの回答

  • sevenless
  • ベストアンサー率66% (374/561)
回答No.2

> 6通りの読み枠で考えて、実際に遺伝子として一個のタンパク質をコードしている読み枠(ORF)のものだけ集めているのですかねぇ。 多分違います。記述を読む限り、既に蛋白になることが分かっている cDNA(ゲノム DNA ではありません) から ORF を読み取り、ゲノム上でその ORF に合う部分を探し出しているのです。

maru2008
質問者

お礼

再度、ありがとうございました。なるほど!わかりやすい ご説明ありがとうございます。助かります。

  • sevenless
  • ベストアンサー率66% (374/561)
回答No.1

Prediction Method として、 Genes were annotated by the Ensembl automatic analysis pipeline using either a GeneWise/Exonerate model from a database protein or a set of aligned cDNAs followed by an ORF prediction. GeneWise/Exonerate models are further combined with available aligned cDNAs to annotate UTRs (For more information see V.Curwen et al., Genome Res. 2004 14:942-50) と書いてあります。蛋白や cDNA のデータを元に遺伝子の場所を決めています。

maru2008
質問者

補足

早速のご回答どうもありがとうございました。論文を詳しく見てみないとわからないかもしれませんが、Ensemblで使われたアルゴリズムは6通りの読み枠で考えて、実際に遺伝子として一個のタンパク質をコードしている読み枠(ORF)のものだけ集めているのですかねぇ。このように考えて正しいですか?

関連するQ&A