Pentium4
検証・CPUパワー
《00.11.23》《00.11.25》

遅いと言われるPentium4のALU。
スループットの遅さを高クロックでどれだけカバーしているのか!?SSE2の実力は!?Pentium3と比較。


《比較対象》

CPU

FSB

コア倍率

コアクロック

メモリクロック

Pentium4

115

14

1610

460

Pentium4

100

10(ES)

1000

400

Pentium3

143

1003

143


《Pentium4の環境》
ASUS P4T 128MBx2 WinMe

《Pentium3の環境》
EPOX EP-BX6SE 128MBx2 WinMe
HostBus Fast Data Ready:on
CAS#Latency:2
SDRAM RAS# to CAS# Delay:3
SDRAM RAS# Precharge:2
Leadoff Command Timing:4
DRAM Leadoff Timing:off

《Sandra 2001》
Sandraの最新バージョン2001 のWhetstoneではFPUとSSE2の両スコアが表示されます。

sandra.gif

《Dhrystone・ALU》
sandradry.gif

整数演算では、P4−1.6GがP3−1Gを押さえて、3000MIPSオーバー。
昔々Intelは2000年に2000MIPSと言ってました。目標オーバーですね。


《Whetstone・FPU/SSE2
sandrawet.gif

な、なんとFPU性能はP3の半分です。どひゃ(^^;

そして期待のSSE2効果は!?・・う〜ん、同クロックのP3のFPUに少し及びません(^^;;
ただ、P3のFPU並にはなるので、
クロック比分の向上は期待できそうです。

《HDBENCH3.22・整数》
hdint.gif

う〜ん。P4-1.6Gを以ってしてもP3-1Gに追いつけません(^^;
追いつくには、推定1.85Gが必要ですね。


このベンチは、メモリ性能にほとんど左右されないので、
モロにALUの性能が出ているのでしょう。


《HDBENCH3.22・浮動小数点》
hdfloat.gif

このベンチは、なんとかP3-1Gを追い越しました。

整数、浮動小数点の2つの結果から、バランス的にP4はP3より浮動小数点が速いようです。

《SuperPI》
superpi.gif

π104万桁の計算に掛かる時間を示します。
つまり、グラフが短い方が良い結果です。


同一クロックでは、P4がなんと3割も遅い結果ですが、1.6Gでは若干勝っています
よく見ると、
HDBENCHの浮動小数点のスコアとそっくりです。
この計算結構メモリ性能が影響するのですが、それが無視できるほどFPUに依存したスコアに
なるということは、2チャンネルRDRAMが優秀なのか、P3のSDRAMが優秀なのか・・

《にゅるベンチ》
にゅるベンチはShade上で動くレイトレーシングベンチマークです。
ShadeはR4試用版をWinMeで動かしています。


3Dですが、ビデオカードのアクセラレーションは使われないので、
結果はCPUの性能に左右されます
また、メモリを数十MB使用するため、OSによって速度差がかなりあります。(NT系は速い)


P3_1gnyuru.jpg

精細モード、アンチエイリシングのグラフィックを描き、所要時間(右上)を比較します

nyuru.gif

SuperPIと似た結果ですが、P4はP3に追いつけませんでした。
P3-1と、P4-1.65Gがほぼ同等になりそうです。


評判通りx86、x87命令は遅いです。
かろうじて、1.6GならP3-1Gに遜色ないかなと言うレベルです。
高クロックを活かすには
SSE2への対応が不可欠に思えました。


kiti30g.gifhttp://kiti.main.jp/