- 締切済み
スパコン京のCPU、8FLOPS×8コア×2GHz
スパコン京のCPUは、2GHzで8コア入っており、1コア1クロックあたり8FLOPSの性能があるそうです。 スパコン京に限らず、インテルのペンティアムとかでも1コア1クロックあたり、4FLOPSとか8FLOPSの性能があるそうですが、これがわかりません。 8FLOPSということは、1クロックあたり、浮動小数点演算が8個、答えが出るということですよね。 なぜ、1クロックあたり8個も答えがでるのでしょうか。 考えられることは、8つの演算器を並列に置いてるから、というのがありますが、これは1コアあたりと制約があるので、演算器は1つで、ということでしょう。 もうひとつ考えられるのは、内部でクロックを8倍に高速に上げていて、1クロックといいながら、演算部では8倍のクロックで回しているということが考えられますが、実際はどうなっているのですか? なにか参考になる資料とかもあれば教えてください。 それと、この場合の浮動小数点演算というのは、乗算器でいいのでしょうか。乗算器ならパイプを切って1クロックごとに1つづつの答えを出すことができると思いますが、除算器はどうなのでしょうか? スパコン京とかの除算器って、乗算器と同じFLOPSで答えを出すのですか? それとも、さすがに除算器は乗算器に比べて10倍くらいクロックがかかったりするのですか? 除算器の構造についても参考になるHP等あれば、教えてください。 最後に、CoreI7 SandyBridgeは、8 FLOPS/Clock × 3.3GHz × 6コアで、158GFLOPSだそうですがこれは、スパコン京に使われているCPUよりも高性能です。 ならこちらを使ったほうが、性能が高かったのではないですか。しかも汎用CPUなので、値段もかなり安くできたでしょう。
- みんなの回答 (6)
- 専門家の回答
みんなの回答
- 山田 太郎(@testman199)
- ベストアンサー率17% (438/2463)
完成までに紆余曲折があったし、コストパフォーマンスが悪いことも事実ですが、 京の目標は最高速のスパコンを作ることだけではなく、 スパコンの基礎技術を国内に残すことでした。 なので基礎技術としてsparc64やTofuの開発込でのプロジェクトとなったのです。 当たり前ですがINTEL製CPUを使ったら目的の一部を達成できなくなります。 あと、8flops/コア/HzですがSIMD (Single Instruction Multiple Data)により1クロックサイクルあたり最大8の浮動小数点演算を実行できるようになってます(あくまで最高値ですが)
- P0O9I
- ベストアンサー率32% (693/2146)
根本の間違い、誰も指摘していないですね。 FLOPSは「Floating point number Operations Per Second」の略で1秒間に何回浮動小数点演算ができるかの値だけです。 その前のG(ギガ)は10億(10の9乗)を意味する接頭辞、だからGFLOPSは1秒間に最高何十億回浮動小数点演算できるかというだけの話。 GFLOPS はクロックとは直接は何の関係もありません。 要は、GFLOPS/Cost 値が高ければ、CPUは別に何を使おうが関係ありません。 富士通は自社のSPARCを、IBMはPower CPUを、その他のCPUを自社で作っていない会社はインテルやAMDのCPUを使う事が多いです。 最近はNVIDIAのGPUを浮動小数点演算に使う事が、GFLOPS/Cost向上に最適だということで、東京工業大学の「つばめ」等に使われています。 http://ja.wikipedia.org/wiki/TSUBAME
- korokokokoro
- ベストアンサー率19% (20/102)
>ここで言ってるのはそういう意味ではなく、一般消費者向けに量産されているという意味ですよ。 質問者自身どうしてx86アーキテクチャーのCPUが採用されなかったか自分で答え出しているじゃないですか。 例で書くとわかりやすいかな? 一般消費者向けの乗用車のエンジンでF1でますか?
- korokokokoro
- ベストアンサー率19% (20/102)
>しかも汎用CPUなので、値段もかなり安くできたでしょう。 京に使われているCPUのSPARC64も専用CPUではなくてSPARCアーキテクチャーの汎用のCPUですけど知りませんか? SPARC系のCPUは元々はSun Microsystems(現在はオラクルに買収された)が開発していた物で これの研究開発を富士通もやっていてそれが利用されてただけだぞ。
- Eureka_
- ベストアンサー率41% (5096/12301)
各数値の妥当性はおいとくとして。 >演算器~コア~ コアあたり演算器が一つと誰が決めました? IntelのCPUには詳しくないんでAMDの例を挙げますが、K7(初代Athlon、もう10年以上前のCPUですか)の段階ですでにx86命令を最大3つ同時実行できましたよ。 並列性で性能を稼ぐ京のアプローチなら、8命令同時実行くらいは平気でやってそうです。それもx86命令セットに縛られなくていいんですし。 >なんでi7~ ヒント:並列構成 Xeonベースのコンピュータで100も1000もCPUを並べた構成ってほとんど聞かないような。ノードの同期をとるのが難しいんだったか。 その辺もあってか、Top500(スパコンの世界ランキング)ではトップクラスをまだOpteronの巨大クラスタから奪還できてないんじゃなかったかな? それに、京は国策プロジェクトとして国内メーカーのCPU開発能力を維持向上させるという目的もありました。そこでアメリカからCPU買ってきちゃ始まらない。
お礼
浮動小数点演算の並列処理とx86命令の並列処理を同列に議論するって、どうなんですかね? チップの占有面積で考えても、まったく桁違いだと思いますけど。 命令の並列処理が出来てることは知ってましたよ。 なんでi7のほうもいろいろとつっこみどころがありますが、論点からずれるので。
- Cupper-2
- ベストアンサー率29% (1342/4565)
最後だけ >ならこちらを使ったほうが、性能が高かったのではないですか。しかも汎用CPUなので、値段もかなり安くできたでしょう。 その通り。 しかし、京の設計段階どころか納品をはじめた時点でサンデーブリッジはまだ世に出ていないんですよ。 また、安定しているCPUを使わないと怖くて使えないってのもあるんです。
お礼
なるほど。サンデーブリッジが世に出ていなければどうしようもないですね。 ですが、コストパフォーマンスからみたら、スパコン京にはいろいろと問題があるのも事実でしょうね。 それとインテルのCPUのほうが使う人が圧倒的に多いので安定性や信頼性に関しては圧倒的にあると思います。 本題から逸れますから、この話はここまでで。
お礼
SPARC64であることは知っています。 ここで言ってるのはそういう意味ではなく、一般消費者向けに量産されているという意味ですよ。