ベストアンサー

スーパーコンピュータとデスクトップＰＣの比較

2002/09/13 10:30

今、スーパーコンピュータって日本に世界最高性能のものがあって、１秒間に３６兆回の浮動小数点計算ができるらしいですが、このスーパーコンピュータの性能を普通のコンピュータが何台集まったら達成できるか？っていうのを調べています。私は、あまりコンピュータのそもそもの仕組みに詳しくないので、３６兆÷普通のＰＣのプロセッサが１秒間で計算できる　　　　　浮動小数点計算回数で考えてみようと思っています。（厳密に言えば、こんな単純な考え方ではダメだと　思うのですが、ここで欲しい情報はあくまで目安　ですので、原理的に間違ってなければ、それで　ヨシと思っています）そこで、「普通のＰＣのプロセッサが１秒間で計算できる浮動小数点計算回数」っていうのがなかなか出てこなくて困っています。例えば、ペンティアム４の1.5GHzだとどうなんでしょうか・・・？

raccoon
お礼率34% (8/23)

その他(PCパーツ・周辺機器)
回答数4
ありがとう数5

みんなの回答 （4）
専門家の回答

質問者が選んだベストアンサー

ベストアンサー

parts
ベストアンサー率62% (6366/10152)

2002/09/13 18:33 回答No.4

NECのコンピュータの話ですか、地球シミュレータは、NECの高速ＳコンSX-5（ベクトル型CPU）を６４０台使（５１２０個のCPU）った物でそれを高速ネットワークで繋いだ物ですね。これは、単一Ｓコン（スパコン、SuperComputer）が達成した技術ではないです。最大計算ノードは４０TFlops（４０兆回のFP演算・・・FPは浮動小数点演算のこと）となります。実用Flopsは解答があるとおりです SX-5Ｓコン単一の仕様は、８Gflopsのベクトル型プロセッサ８個を実装したもので、最大計算ノード６４Gflopsとなります。これが、このＵコン（UltraComputer）に６４０台使われて始めてこれだけの処理能力になりました。を利用した。（このコンピュータ群はＳコンとはワンランク上のUltraComputerとして開発されました）まず、この点分かりますかね。このUコンはSコンをさらにいくつかまとめたUltraComputerに相当します。（次元が違うと言うことです）次にPentium４の最大速度ですが、正確にはインテルの数値は最大値ではないですね。SSE命令ユニット（Pentium４、３共通ですがPentium３は単精度演算のみ）は、同時に４つの和と４つの積算処理を２クロックで行えたはずです。このタイプの処理なら最大で６Gflops（６４ビット単精度）に達するはずです。ただし、一般的にこの処理が連続で行われることはないため、３Gflops＜３０億回のFP処理＞（１２８ビット倍精度）になります。元々、Pentium4を初めとするインテル系プロセッサ（IA-32）はちょっと上の物とは異なるCPUで、特定の命令を命令セットという形で浮動小数点演算の一部を最適化しているCPUです。上のSX-5に用いる物は、プロセッサ全体が浮動小数点演算に最適化されています。そのため基本命令だけで計算すると浮動小数点演算よりも整数演算器（ALU）を中心とするx86型のプロセッサになり、FP演算値の精度は低下します。最大実用値はあくまで３Ｇ（絶対最大値は６Ｇ）となり、実際実用平均値は２，５Ｇ前後のはずですが、SSE命令が伴わない処理では速度はG（１０億回のFP演算）を越えない可能性も高いです。ちなみに、たいていの方はご存じのプレイステーション２（SCEI）がありますよね。これは、Pentium４より速いです。単一のプロセッサ（エモーションエンジンというCPU）で６～6,4Gflops（６４億回の浮動小数点演算）が可能です。これには、１０個の浮動小数点積和算ユニットと４個の浮動小数点除算ユニットを装備しており、単一のプロセッサの中に浮動小数点演算だけならPentium４-1,5GHzが２個分内蔵されているのですよね。ついでに、もう一つ補足です。「単純に言えば単精度ならクロック数＝ＦＬＯＰＳ」は間違いですね。たまたま、Pentium４が倍精度で同じに見えただけですがPentium４でもそうではありません。クロック周波数は演算器その物の処理速度ではなく、命令を載せる回路（ベルトコンベア）の速度に過ぎないのです。ベルトコンベアに一度に載せられる命令数が１つであれば、Flops＝クロックになりますが、もし２つなら一度にクロック当たり２処理です。３つなら３処理、４つなら４処理となります。よって、クロック＝Flopsにはなりません。それに、倍精度でPentium４は１，５Gflopsですし、単精度では３Gflopsでその時点で釣り合わないですからね。ここはちょっと、分かり難いですね。見逃してください（笑）最後に、分かりやすくPentium４で何台ぐらいあれば良いか書いてみますと、Pentium４-１，５GHzを平均値で約２Gflopsとして８Gflopsを達成するために、４個プロセッサが必要です。これで、SX-5に使われるベクトルプロセッサ（確か１プロセッサ５００ＭＨｚで駆動する）１つ分となります。さらにSX-5コンピュータ本体にベクトルプロセッサ８個で４×８＝３２個ですね。それに６４０台のSX-5が必要で３２×６４０＝２０４８０個となります。簡単な数字で出せば、５１２０個のベクトルプロセッサ×４個のPentium４ですね。よって、Pentium４PCなら２０４８０個のCPUに相当ですかね。単純計算ですけどね。

ログインすると、全ての回答が全文表示されます。

その他の回答 (3)

Pesuko
ベストアンサー率30% (2017/6702)

2002/09/13 15:37 回答No.3

＞少し難しい説明文単純に言えば単精度ならクロック数＝ＦＬＯＰＳです。ＦＬＯＰＳ＝フローティングポイントインストラクション（浮動小数点演算）・パー（割る）・ＳＥＣ（秒）です。したがって１．５ＧのＣＰＵなら１秒間１．５ギガ回浮動小数点演算を実行します。今の２．５ＧのＣＰＵなら秒間２．５ギガ回になります。倍精度の場合はその半分の速度になります。

ログインすると、全ての回答が全文表示されます。

Pesuko
ベストアンサー率30% (2017/6702)

2002/09/13 11:24 回答No.2

Ｐ４－１．５Ｇでインテルのサイトから例: SSE2 の浮動小数点乗算命令を使用すると仮定します。このような SIMD 命令の場合は単精度と倍精度で実行速度が異なります。単精度の場合2クロックで4つの結果を導きますのでプロセッサ 1.5GHz の場合はピーク 3.0GFlops、倍精度の場合2クロックで2つの結果を導きますのでプロセッサ 1.5GHz の場合はピーク 1.5GFlops で乗算を処理します。 (ただし一般には、メモリ・アクセスに要する時間等の他の要因でピーク性能を得ることはできません。) でもあまりにも単純な考え方で、その計算結果は実際とはかけ離れた結果になると思います。

参考URL：: http://www.intel.co.jp/jp/developer/design/pentium4/faq/#q_a1

質問者

お礼 2002/09/13 13:29

ありがとうございました。素人には少し難しい説明文ですね(笑)。

ログインすると、全ての回答が全文表示されます。

noname#5751

2002/09/13 11:10 回答No.1

NECの『地球シミュレータ』ですね。 1秒間に35.9兆回の演算能力＝35.9テラフロップスの性能があるそうです。参考までに、イギリスのローレンス・リバモア国立研究所で開発中のLinux版スーパーコンピューターは2.4GHz版 Xeonプロセッサーを1920基をクラスターで動かして9.2テラフロップス(1秒間に9.2兆回の演算処理)の性能を実現するそうです。その約４倍の性能ですね。パソコンのCPUは1～2ギガフロップス（1秒間に10～20億回の演算能力）だったと思います。ただ、個数を増やしても単純に処理能力が「足し算」されるわけではありませんよ。

質問者