OpteronとXeonを比べてみる《2003.5.4》

大箸さんのOpeteronを試してみるとのジョイントコンテンツです


大箸さんがOpteron240のデータを提供くださいましたので、ウチのXeon2.4(533)と比較しました。
あくまで32bit環境での比較ですが、Opteronの特徴を垣間見たいと思います。


《環境》

Opteron240(1.4GHz)x2

Xeon2.4GHz(FSB533)x2

K8D Master-F

IWill DP-533

512MBx4 DDR333 2CH
CPU0、CPU1で4枚共用

512MBx2 DDR266 2CH
CPU0、CPU1で2枚共用

Windows XP Pro(SP1)

Windows XP Pro(SP1)



《3DMark03?》
残念ながらMaster-FにはAGPが無いので検証できません。
但し、PCI用のグラフィックカードは使用可能とのことです。


《レンダリング性能》
Opteronがメモリコントローラをプロセッサに統合したことによるアドバンテージを検証するために、
メモリアクセスの多いレンダリングを試してみます。


アプリ

shade R5 DEMO版

データ

にゅるベンチ


・1タスクの結果
shade01.gif
※単位秒:時間が短いほど高速

shadeに関してはOpteron420はXeon2.4GHzの0.885倍(2.12GHz相当)です。
このため、Opteronの処理時間を0.89倍してマルチタスクの差を検証することにします。



・マルチタスクの結果
各タスク毎の処理時間を積み上げたものです。
上から、1タスク・2タスク・3タスク


shade02.gif
※単位秒:時間が短いほど高速(Opteronの処理時間は0.885倍しています)

メモリアクセス効率の差を見るためXeonはHT無効を基準にしています。

3タスクになるとタスク毎の処理時間が間延びし、ばらつき(100秒〜200秒)が出てきます。
処理時間の合計では、Opteronが10秒速くなっています。
メモリアクセスが忙しい状態でのパフォーマンスアップなので、
これがメモリコントローラ内蔵の恩恵かもしれません。


XeonはHTを有効にするとタスク毎のばらつきがなくなり処理時間も改善されます。
この観点から見るとHTの効果は意外と(?)大きなものです。


Sandra2003・SP1build9.44

このベンチではOpteronのメモリパフォーマンスが計測できませんでした。
IWill DP-533の初期リビジョンでもメモリ4枚挿しでは計測できないケースがあります。
原因は不明です・・


・CPU
sandcpu.gif

数値を見る限りOpteronのWhetstoneバーはDhrystoneと同じ位の長さになるはずですが・・
表示がおかしくなってるみたいです。


・SSE
sandsse.gif

・SSE2
sandsse2.gif

SSE2についてはクロック比以上の差があります。
Pen4の高クロックを活かすために実装された命令なので仕方がないのかも知れません。


《HDBENCH3.30》

・CPU
hdcpu.gif

hdcpug.gif

・メモリ
hdmem.gif

hdmemg.gif

このテストでは両者の特徴が極端に出ています。
Readが高速なXeon、Writeが高速なOpteron。
どちらも高速に・・とはいかないのでしょうか(^^;


今回のベンチでは、Opteron240はXeon2.4GHzより振るわない結果でした。
しかし、ビジネスユースのベンチでは結果が逆転するようですし、
メモリインターリーブでメモリパフォーマンスの改善も可能です。
そして、64bitのステージがもたらす新世代のパフォーマンスに期待!ですね(^^



kiti30g.gifhttp://kiti.main.jp/