• ベストアンサー
※ ChatGPTを利用し、要約された質問です(原文:手厳しいデータベース)

手厳しいデータベースとは?

このQ&Aのポイント
  • 手厳しいデータベースの意味を解説
  • プロテインデータバンクの問題点とは?
  • データダンプについての疑問点

質問者が選んだベストアンサー

  • ベストアンサー
  • sknuuu
  • ベストアンサー率43% (408/934)
回答No.3

it should not be too far behind この表現は大体、"時間的な遅れ"  簡単に言うと、遅れをとっちゃあかん、ということ >>40年以上もの間、プロテインデータバンクはその道の構造科学者たちによって密接にデータが関連付けられ保持されてきた。世界中の大半の生物学出版機関誌(もちろんわがNatureも含む)が出版の前にPDBへの構造データの蓄積をされることを望む。 40年以上もの間、プロテインデータバンクは[構造科学者たちがデータを保存していた場所]であった。世界中の大半の生物学出版機関誌(もちろんわがNatureも含む)は、出版の前にPDBへの構造データの蓄積(保存)を[条件とした](=PDBにデータ保存しなければ出版しない) >>(2)So there was considerable worry at the database when Nature accepted a molecular map of HIV’s capsid protein shell last year (G. Zhao et al. Nature 497, 643–646; 2013). The multimillion-atom complex was larger than anything then in the PDB, and the database’s team had to devise a way to make the data dump available (and useful) at short notice. at short notice 話しがあってから短時間で; 通知から短い時間で ... data dumpというのはコンピューターの専門の用語のようですが、データ出力に関することのようです だから、昨年Natureが受けたmolecular mapはとてつもなく大きなデータ(PDBが保管しているデータで一番大きかった)なので、出力にそれなりに(保存もそうでしょうが)長い時間が必要 それを短い時間でできるような新しい方法を考えなきゃいけなかった、ということ つまり、たぶん、出版までの短い間に、そのとてつもないデータ処理をなんとかしなきゃいけなかった larger than anything then in the PDBの部分は その当時(then)< = when Mature accepted a molecuar map>、PDBに保存されているどれよりも(どのデータよりも)大きいものだった データが大きいから時間がかかる → 遅れちゃあかん(should not be too far behind) 最初とつながりましたよね

ligase
質問者

お礼

感動しました。本当に最後が最初に繋がってますね!! また(1)ではwhereの的確な訳のご指導ありがとうございます。 then はその当時という意味合いなんですね。いつもその後という言い方でどうして今の話をしてるのに事後のことを?と勝手に悩んでました。 いつもありがとうございます。

その他の回答 (2)

noname#212313
noname#212313
回答No.2

>(1)Behind every great discovery is a pile of data; but, crucially, it should not be too far behind. >偉大なる発見の裏には必ずデータの蓄積が伴うが、重要なことは裏付けがはるか遠くにあってはならないのだ。  いいと思います。一応、別訳例も。 「全ての偉大なる発見の背景には、それぞれ山のように積み重なったデータがあるのだが、大事なのは、それ(=データの山)があまりにも遠い背景であってはいけないということだ。」  発見(≒論文)の基礎となったデータがtoo far behind(遠く後ろに離れすぎ)ではいけないのですから、発見に関するデータがちゃんと参照できるようにすべし、ということでしょう。直接的には論文が使ったデータが、査読者や追試者の誰でもアクセスできることでしょう。もしかすると論文そのものもデータからかけ離れた解釈をしないといったことを含むかもしれません(それをチェックするにはデータのアクセス性のよさが必要、という点に立ち返って来る)。 >(2)So there was considerable worry at the database when Nature accepted a molecular map of HIV’s capsid protein shell last year (G. Zhao et al. Nature 497, 643–646; 2013). The multimillion-atom complex was larger than anything then in the PDB, and the database’s team had to devise a way to make the data dump available (and useful) at short notice. >そのため、ネイチャーが昨年HIVのカプシド骨格の分子マッピングを承認したとき、このデータベースに載せる県で考慮すべき懸念が生まれた。このカプシドタンパクの殻は数百万の分子複合体がPDBに登録されているもの以上に莫大なものであったため、データベースのチームはぎりぎりでデータダンプを行える方法を考案しなければならなかった。 「そのため、ネイチャー誌がHIVの外衣タンパク質であるカプシドの分子地図を受領した時(G. Zhaoら、 Nature 497号(2013年)、643–646ページ)、データベースにおいて憂慮すべき事態が起こった。その何百万もの原子よりなる集合体は、当時の蛋白質構造データバンク(PDB)にあったどんなものよりも(データとして)大きかったのである。そのため、データベース班はデータダンプ(=情報をハードディスクなどに記録したもの)をすぐさま利用可能に(そして有用に)するための方法を工夫しなければならなかった。」  PDBに登録されるのは生物のタンパク質についての、原子レベルの構造データです。構造をPDBでのゴーマットに従って記号的に記述したものでないといけないわけです。数百万個の原子の絡み合いが、どれほど膨大なデータであるかは察しがつきます。  画像データ(写真や模式図)などから、何がどうつながっているかを記号としてデータ化するのは容易ではないでしょう。それを当該論文の出版前に済ませないといけないわけです。非常に短期間であるわけですね。あるいは、論文執筆者が提出した独自フォーマットのデータを、PDB向けに変換するということであったかもしれません(これはこれで別の苦労が生じますが割愛)。  そういう、コンピュータ利用技術の問題を述べています。お考えの通り、hard dataは「確かなデータ」以外に、「扱うのに苦労するデータ」という二重の意味のタイトルであるのでしょう。

ligase
質問者

お礼

いつも素敵な訳のご指導誠にありがとうございます。 教科書のcellだとかに付属のDVDのタンパクのの立体構造だとかも読み込むのにパソコンがキュルキュルフル稼働していたのを思い出しました。それが数百万の分子量というのだからダウンロードアップロードの円滑さ同行ではなく純粋に「重すぎる」データなんだということが非常に理解できました。 いつもありがとうございます。

  • Oubli
  • ベストアンサー率31% (744/2384)
回答No.1

(1) 偉大な発見の後ろにはデータの蓄積があるが、重要なことはデータがあまりにも後にあってはいけないということだ 背景データと発見(結論)の間に大きな距離がある場合は、結論の妥当性が疑わしくなるということでしょうか。 (2) any protein in the PDB at that timeの意味だと思います。 data dumpは(タンパク構造の)データをダウンロードすること 分子量がいままでに登録されたタンパクよりもはるかに大きいので、従来のデータベース構造ではダウンロードがうまくできず、短期間にそれが可能な仕組みを構築しなければならなかった(そして構築できた)、ということでしょう。

ligase
質問者

お礼

ご教授ありがとうございます。 ダウンロードがサーバーとデーター量の関係で構築が難しいほどの分子量ということなのですね。 タンパクの大きさを言われてもぱっとこないのですが複雑なものほど三次元の画像は重たくなるイメージしかなかったので非常にわかりやすい訳のご指導で大変助かりました。 いつもありがとうございます。