2010年10月29日金曜日

AMD Phenom II x6 1090T の数値計算ベンチマーク

これでようやく、数値計算ベンチマークの一つであるfMarkを走らせて、AMD Phenom II x6 1090T (Black Edition)がどの程度速いのか測定することができる。コンパイラはもちろんIntel Fortran Compiler (IFC)を使用する。ただし、今回は1コアだけにプログラムを走らせて測定することにする。

ちなみに、Phenom II x6 1090T (Black Edition)は、AMDのPC用CPUラインアップの最高峰にあるモデルで、動作周波数3.2GHz、TDP125Wで、CPUの動作倍率が変更可能な設計になっている。

参考までに、Core i7-870のfmark測定値は60弱だった。IFCのコンパイルオプションは-xSSE4.2 -fastとした。またCore 2 duoのfmark測定値は20強だった。(つまり、i7-870の1/3のスピードということである。)これほど遅い主な理由は、後者のCPUはSSE4.1までの命令しか使えないからであろう。

さて、注目の6-core Phenom IIだが、そのfmark値は30弱であった。i7-870の半分しか行かないとは!正直がっかりした。実は、Phenom IIは、core 2 duoと同じで、SSE4.1までの命令しか使えない。「CPUを設計した本人が、その機能を最大限に生かせるコンパイラをも作ってしまうんだから、AMDがIntelに勝つのはかなり難しいな」というのがこの結果の感想。

それにしても、SSE4.1とSSE4.2の差が2倍以上もあるというのは驚きだ。おそらく、その差はベクトル化関連の命令でついていると思われる。というのは、結果を見ると、行列演算などで大きな差が出たからだ。一方、同じSSE4.1で走らせたCore 2 duoとPhenom IIを比べると、後者の方が1.5倍速い結果となった。2年前なら、この結果をみて「AMDに即時移行」ということになったのであろうが、今となっては「遅かりし」である。

つぎに、Crosshair IV formulaの自動OverClockボタンを押し、BIOSで「Extreme OC」を選択して、再度Phenom IIの測定を行った。若干の改善があったものの、その結果はfmark値にして35弱であった。手動でOCすると多少は改善するかもしれないが、60という値には到底届かないだろう。再度がっかり、というより、がっくり。このマシンでOCをやる気が完全に失せた。

冷静に考え直すと、SSEの差に加え、AMDではあまりTurbo倍率が大きくないというのも問題になっているような気がしてきた。i7/i5 (Lynnfield)のTBTはかなり挑戦的な倍率だったのに比べると、非常に残念な設定だ。この比率をいじれるBIOSやマザーボードがあればまだやる気が湧くんだが。

せっかく6 coreもあるのに、この性能ではなかなか買う気にならない。4 coreだとしても、i7-870を2つ買った方が、はるかに高速なシステムを、それなりに安価な価格で構築できるような気がする。

次の目標としては、並列計算をやらせてどういう結果になるか見てみたいとは思うのだが、Phenom II (x6)に関してはもうやる気がかなり削がれてしまったので、実際やるのはちょっと先のことになるだろう。AMDが、数値計算用途でIntelに勝つためには、Phenom II対応の自前コンパイラを開発する必要があろう。それまでは、Intel core i7/i5とIFCのコンビネーションは数値計算においては最強であり、しばらくはAMDの付け入る余地はほとんどないだろう。

0 件のコメント: