GeForce256 ClockUp

CREATIVE 3D BLASTER GeForce をGETしました。
その性能には驚かされました。但しドライバがハングしやすいなど、現状は問題もあります。


《目次》
・スペック
・現状の問題点
・ハードウェアT&Lの性能テスト
・D3Dベンチマークテスト
・D3Dベンチマークテスト(ゲーム編)
・OpenGLベンチマークテスト
・OpenGLベンチマークテスト(ゲーム編)
・2Dテスト
・総評


《関連記事》
・HardWareT&L VS SoftWareT&L VS SSE

(3DMark2000による、ハードウェアT&Lの検証)
・Coppermine VS Athlon @ HwrdWareT&L
(3DMark2000による、CoppermineとAthlonの対決)
・GeForcePro VS GeForce VS TNT2 VS G400 @ SSE
(3DMark2000による、GeForceProとGeForceとTNT2とG400の対決)
・GeForcePro VS Geforce @ 最速設定
(GeForceProH・T&Lで本領発揮6000オーバー(^^;;)
(3DMark2000による、最速設定の対決)

・SDRAM VS DDR-SGRAM @ 同クロック
(GeForceProがGeForceと同じクロックだったら!?)
・DDR&NewAMD751S VS SDR&DRAMD751
NewAMD751は3DMark2000を加速するか!?)
(また、
H/T&LDDRGeForceに思わぬ死角が!!)
・AGP性能検証
(GeForceでAGP1/1、2/3、disableの性能差を検証)
・AGP ClockUp耐性
(AGPクロック126MHzでWin起動、135MHzでVGA表示)
・GeForce With Glide(Glideが動いちゃいます^^;
・Newドライバ3.53比較(裏技おまけ付き)
・PowerStrip・Vsync/Clock調整方法




《スペック》

Normal

Videoメモリ

SDRAM 32MB/5n

コアClock

120MHz

メモリClock

166MHz


上記標準Clockに加え、OverClockの確認もしています。
標準のBLASTER コントロール・パネルでも、
メモリClockのみ150〜183MHzの範囲で変更できますが、
PowerStripを使うと、メモリ100〜250MHzコア100〜200MHzの範囲で変更可能です。

クロックアップ耐性は非常に高く、2ランク(?)ぐらい上の設定でも正常動作しました。
メモリについては5n(200MHz仕様)を使っているので、当然!?


OrverClock

コアClock

150MHz

155あたりが限界?

メモリClock

200MHz

230で2D画面にゴミ
215で3Dバッファが誤動作


あくまで、わたしの環境での動作であり、クロックアップを保証するものではありません。


テスト環境

CPU

Athlon500@650

メモリ

128MB/CL2

マザー

MS-6167

サウンド

SB16/ISA

Vsync

Off


標準のBLASTER コントロール・パネルにはVsync Offの設定がありますが、有効に出来ません。
PowerStripでは有効に出来るので、コントロール・パネルのバグと思われます。


《現状の問題点》

@ 標準のBLASTER コントロール・パネルでは、D3D使用時にVsync Offが有効になりません
  そのため、ベンチ結果が、モニタやベンチで設定されるリフレッシュレートで制限されてしまい、
  カードの性能を出し切れない場合があります。コレは、
PawerStripで設定可能です。

A ベンチマークテスト(FR/3DMarkMAX)が極めて不安定で、特にカードをクロックアップした場合、
  ほとんど正常終了しません。3Dゲーム等は、長時間のプレイでも問題ないので、ベンチマーク特有の
  シビアなタイミングに、ドライバ側のマージンが追従できないものと思われ、今後のバージョンアップで
  安定することを期待します。



《ハードウェアT&Lの性能テスト》

TreeMark
現在、新機能に対応しているnVIDIAのTreeMarkで検証します。

GeForce御用達ベンチか(笑)とにかく重い・・ブツはココにあります。
このベンチはOpenGLを使用しています。(寺田さん、ご指摘ありがとう)


次の2つのテストの平均フレームレートを見ます。
Simple:polygons per frame: 35820
Complex:polygons per frame: 128080


TreeMark.gif

赤字:最高青字:次点

Simple

Complex

TNT Normal

12.7

2.9

GeForce Normal

42.3

12.2

GeForce OverClock150/200

52.6

15.3


TNT比4〜5倍という驚異的な能力を示しています。


《D3Dベンチマークテスト》

FinalRearety

このテストはオーバークロック状態では1度も完走しませんでした。
CPU環境が異なりますが、VooDoo3-3000も比較対象にしています。



赤字:最高青字:次点

VooDoo3
P3-450@600

TNT 
Normal

GeForce
Normal

Radial blur
Chaos zoomerps
25 Pixel
Robots
Fillrate
City scene
Video card bus transfer
Direct3D bus transfer
Visual appearance

 58.261581
 97.496422

496.306122
124.118805

110.666534
148.689819

188.267075
174.435059

100.000000

 60.570160
106.873116

421.100830
118.239426
 46.855671

151.035278
 45.678429
 67.854759
100.000000

 61.978970
109.76763
9
457.239960
123.004799

180.681931
140.359818
149.727310
 88.925743

100.000000

rips
rips
kpps
rips
MPps
rips
MBps
MBps
%

Overall 3D
Overall 2D
Overall bus rate

  6.263715
  6.397872
  8.668394

  5.877509
 
 6.785336
  2.757850

  6.430909
  6.953088

  5.616955

Rmark
Rmark
Rmark

OVERALL SCORE

  6.664664

  5.681909

  6.465469

Rmark


一見してわかるのはGeForceのFillrateの高さです。

Direct3D bus transferが、VooDoo3に引き離されているのは、BX440チップセットとAthlon用
チップセットの違いによるものと思われます。
Athlonで
67.854759を示すTNTは、P3-450@600では144.695313ですので、GeForceも
VooDoo3並でしょう。



3DMarkMAX

赤字:最高

TNT 
Normal

GeForce
Normal

3DMark Result

 4549.62

 5987.54

3DMarks

Synthetic CPU 3D Speed
Rasterizer Score

11020.80
 1394.11

10903.24
 3386.90

CPU 3DMarks
3DRasterMarks

Game 1 - Race
Game 2 - First Person

   39.84
   53.02

   70.58
   51.99

FPS
FPS

Fill Rate
Fill Rate

  139.79
  141.64

  261.49
  436.12

MTexels/s
MTexels/s

2MB Texture Rendering Speed
4MB Texture Rendering Speed
8MB Texture Rendering Speed
16MB Texture Rendering Speed
32MB Texture Rendering Speed

  212.72
  148.89
   95.00
   51.36
   30.96

  331.93
  243.44
  159.95
  108.38
   42.43

FPS
FPS
FPS
FPS
FPS

Bump Mapping Emboss, 3-pass
Bump Mapping Emboss, 2-pass
Bump Mapping Emboss, 1-pass

   62.15
   75.55
  123.08

  138.77
  170.56
  252.58

FPS
FPS
FPS


GeForcefが多くの項目でTNTの2倍近い結果を出します。
Fill Rateについてはスペック通りの高い値を示しています。


明らかに1.5〜2世代の性能差があるようです。


5・D3Dベンチマークテスト(ゲーム編)

Incoming(デモ版) D3D

gameindex.exe を-screenmodeオプション付きで実行し、解像度を選択。
デモ終了時に作成されたfps.txtの結果を見ます。


1024x768 16bit

GeForce激速!VooDoo3-3000の2倍のフレームレートを出しています。
OverClock動作もしっかり速くなっています。


Incaming.gif

1024x768 32bit

32bitモードでも16bitのVooDoo3以上の結果を示しました。

Incaming32.gif


Forsaken

Forsaken:デモ(nuke)終了後、デモの選択画面でアベレージを見ます。

1024x768 16bit

Incamingほどの差はありませんが、GeForceの速さは際立っており、OverClock動作で更に加速。
Forsaken16.gif

1024x768 32bit

Fosaken32.gif


D3Dの結果からは、ハードウェアT&Lを使わない既存のアプリでも、最高レベルの性能
発揮できることがわかります。



《OpenGLベンチマークテスト》

シリコングラフィックス社の ONYX RealityEngineIIを 100.0 とし、それに対しての割合を出すものです。
  
吉田洋史氏作

比較対象のONYX RealityEngineIIのスペック
  CPU: MIPS R4400 150MHz
  FPU: MIPS R4010 150MHz
  L1cache size: データ16 KB/命令16 KB
  memory:256 MB/2-way interleaved


赤字:最高青字:次点

TNT 
Normal

GeForce
Normal

GeForce
OC 150/200

3D swap_buffer
3D lines
3D lines fog
3D lines smooth
3D points
3D points fog
3D wire
3D wire fog
3D polygon color smooth
3D polygon color
3D polygon color fog
3D vertex color
3D vertex color fog
3D stencil buffer
3D accumlation buffer
3D blur
3D flat shading
3D smooth shading
3D spot light
3D T-Map GL_CLAMP fast
3D T-Map GL_CLAMP real
3D T-Map GL_REPEAT fast
3D T-Map GL_REPEAT real

2153.571891
 102.192866
 100.808222
  53.924030
 199.889077
 115.479451
 198.367338
 111.436959
 
273.018664
 342.092760
 335.171000
 350.506495
 345.242780
  18.239030
  14.599617
   7.731611
 164.219833
 163.060777
 184.115475
 353.211528
 368.292251
 351.765662
 322.305561

3830.777650
 551.303618
 479.128736
 115.786875

 883.887832
 888.303472
 887.677962
 886.624760

   2.907002
 888.490919
 885.579606

 873.507791
 868.512630
  16.042374
  14.744847
   7.830803
 775.380610
 779.491472
 712.028767
 774.327287
 777.314642
 787.311475
 783.535933

4469.240591
 586.001049
 578.947222
 117.417676

 873.674842
 877.059124
 876.453372
 877.272178

   3.003228
 875.397368
 876.247893

 876.266237
 881.393114
  16.846961
  15.810844
   8.389848
 962.726908
 970.961438
 887.566275
 773.128638
 782.188088
 783.603571
 787.237677

3D total

 203.439590

 619.987246

 649.436071


TNT比、著しく性能が向上しています。
しかし、3D polygon color smoothについては、ナゼかアクセラレーションされていないようです。
面白いのは、NormalとOC 150/200で、性能が逆転している項目があることです。
これは、何度実行しても同じ結果になります。


技術の進歩はスゴイものがあります。5年前のPentiumPCでは0.1〜1.0程度の値しか出なかった
このテストで、モノによっては ONYX RealityEngineIIの9倍という値を示すのですから。
これだからPCはやめられません(^^



《OpenGLベンチマークテスト(ゲーム編)》

QuakeU & Sin

QuakeII :プレイ開始直後に半角/全角キーでコンソールを表示し、
       Timerefreshをタイプし、360度画面を見回した後のアベレージを見ます。
Sin    :ヘリポートに出た直後に半角/全角キーでコンソールを表示し、
       Timerefreshをタイプし、360度画面を見回した後のアベレージを見ます。


1024x768 16bit

Q2Sin.gif

傾向はD3Dとほぼ同じです。
これから言えることは、OpenGLのハードウエアT&Lがポリゴン数の少ないゲームではあまり威力を
発揮しないか、または、VooDoo3がD3DよりMiniGLの方が性能が高いということです。
どちらであるというよりは、多分両方でしょう。



《2Dテスト》

HDBENCH2.60

定番ベンチのグラフィックステストです。

GeForceはNormalでは、僅かにVooDoo3-3000に及ばないものの、OverClockにより逆転します。
VooDoo3-3000のデータは32bitのみです。


HDGraph.gif


《総評》

GeForceは、Vsincを外すことで、本来の性能を発揮します。
D3Dにおいて、この機能が使えない現状では、ハードウエアL&Tを除くGeForceの能力が低く評価される
ことになりそうです。しかし本来は、現在のハイエンド3Dカードを凌ぐ能力を持っていると思われます。


そして、GeForceの大きな特徴は3Dの3大エンジンである、「トランスフォーム」「ライティング」
「トライアングルセットアップ&クリッピング」のすべてをハードウエアで備えている点です。


従来のD3D環境では、「トランスフォーム」 「ライティング」はエミュレーションでのみ実装しており、
アプリでは、性能面/自由度の面からコレを使わず、自前のエンジンを使っていたようです。
この機能はDX7から、ハードウエアがサポートされますが、アプリがハードウエアエンジンを使うことを
明示しなければ、従来通りエミュレーションになるため、アプリが対応するまでこの機能は生かされません。


現在nVIDIAのTreeMarkがOpenGLにてハードウエアエンジンの性能を引き出しています。
OpenGLは、アプリが明示せずにハードウエアエンジンが使われます
D3Dでは、DX7SDK付属のサンプルソフトが対応しています。



この機能を使った場合の性能向上はすさまじいものがあります。
現在は宝の持ちぐされかもしれませんが、持ってるだけで安心!?ですよね(^^




kiti30g.gifhttp://kiti.main.jp/