Tualatinの謎《2001.7.22》

Tualatinには、L2-512KBのPentium3-Sと、256KBのPentium3(将来のCeleron)が存在します。
基本的には、Coppremineのプロセス縮小版と言われていますが、そこにはいくつかの謎が・・


《データシートの謎》
0.13μプロセスのPentium3について、Intelのサイトには二つのデータシートがアップされています。
L2-512KB版(Pentium3-S)
Pentium III Processor with 512KB L2 Cache at 1.13GHz Datasheetと、
L2-256KB版
Pentium III Processor at 1.13A to 1.20GHz on 0.13 micron process Datasheetです。

この二つのデータシートを見比べると、L2キャッシュサイズ以外にも違いがありました。
それは、L2-256KB版の機能説明にある「Data Prefetch Logic」が Pentium3-Sには無いことです。


Data Prefetch Logic

Data Prefetch Logic adds functionality that anticipates the data needed by the
application and pre-loads it into the Advanced Transfer Cache, further increasing
processor and application performance.


Data Prefetch Logic
・・AthlonMPで、Pentium4でサポートされた機能をTualatinでもサポートしていた・・
しかし、なぜかPentium3-Sには機能が無い。


L2-512KB版の方は、0.13μとは明記されていませんが、ステップID(06B1)や電圧などから、
同じステッピングのTualatinであることは間違いありません。


もしかすると、Pentium3-Sのデータシート作成時にはさほど重視していなかったものの、
にわかに新しい機能として注目されたため、後発のL2-256KB版には追記したのかも知れません。
L2-512KB版が、機能面でL2-256KB版に劣るとは考えにくいですし(^^;


《動作環境の謎》
Intelサイトの
Pentium-3 S-Specより
sspec.gif

TualatinのステッピングはTA1です(Pentium3-SもPentium3も同様です)
消費電力は、Coppermine-T比同一クロックで25%程低下しているようです。
FC-PGA2同士の比較で、意外と消費電力が高いように見えるのは、L2が増加したためでしょうか・・


Coppermine-T対応マザーとTualatin対応マザーの条件は違います。

Coppermine-Tは従来のAGTL+/シングルエッジクロッキングをサポートするため、
BIOSのみの対応で旧来のチップセットでも動作します。
しかし、TualatinはAGTL/ディファレンシャルクロッキング※専用となるため、

AGTL/ディファレンシャルクロッキングをサポートしたチップセット以外では動作しません
(現状ではi815BStepまたはSiS635Tのみ動作)


※2本の信号線を対称的(逆相)に駆動してノイズを打ち消しクロックマージンを確保する方式。

《キャッシュアクセス速度の謎》
TualatinのL1はCoppermine同様、16 KB instruction and 16 KB data cacheです。
L2も同様で、on-die,full speed Quad Quadword(256bit) cacheとなっています。


これはつまり、同一クロックでCoppermineと比較すれば同じ性能となるはずです。
しかし、不思議な結果になりました・・


−検証方法−
TualatinとCoppermineをコア同速とします。
手持ちのTualatinは8.5倍、Coppermineは7倍、両者のコア速度が同じになるのは、
952MHz(8.5x112、7x136)なので、このクロックで検証しました。


マザーはGigabyte GA−60XET、ソフトはWin9x環境用Cortest99です。


−L1キャッシュ性能(4KB)−
cl1.gif

結果はクロック誤差程度なので、L1は全く同じといって良さそうです。

−L2キャッシュ性能(64KB)−
cl2.gif

L2では、なんとTualatinのwrite性能がCoppermineの倍近く出ています。

キャッシュの構成も8ウェイ、32Byteラインと差がないはずです。
考えられることは、エントリ数の違いによるソフトの動作の変化、または、
L2のデータバスにデータシートには無い何らかの改善があるかでしょう。


・・それともData Prefetch Logicの恩恵!?


《メモリアクセス速度の謎》
Tualatinで、特にメモリ性能を向上させたと言うアナウンスはありません。
ディファレンシャルクロッキング方式に進化したとは言え、FSBが同じならメモリアクセス速度も同じはずです。


しかし、ここでも謎を残しました・・

−検証方法−
TualatinとCoppermineのFSBを133(CL2)で同速とします。
手持ちのTualatinは8.5倍、Coppermineは7倍、なのでコア速度は異なりますが、
メインメモリの転送速度への影響はほとんど無いはずです。


マザーはGigabyte GA−60XET、ソフトはWin9x環境用Cortest99です。


−メインメモリ性能(4MB)−
clm.gif

ここではread性能に2倍以上の違いが出ています。

バスで変わったのはディファレンシャルクロッキング方式になったことだけです。
これが何らかのアドバンテージを生んでいるのでしょうか?


《深まる謎》
驚異的なメモリ性能を別角度から検証するため、HDBENCH3.22及び、
DOS環境のPfm686も試してみましたが・・
結果は変化無しでした。


−HDBENCH3.22(メモリテスト)−
cl1.gif


ならばCortestの結果はやはりソフトの誤動作なのでしょうか!?

しかし、同クロックでTualatinとCoppermineを比較した「512KB-L2パワー」では、
L2の容量の違いだけとは思えない差が見られました・・



kiti30g.gifhttp://kiti.main.jp/