nggalai
2001-11-17, 14:12:54
Hi there,
angeregt durch die verschiedenen Artikel zu den neuen Radeon8500er Treibern auf dem Netz und Xmass Post im Beyond3D Forum (hier: http://bbs.pcstats.com/beyond3d/messageview.cfm?catid=3&threadid=1331) habe ich mich mal hingesetzt, um die Unterschiede zwischen bilinearem anisotropem Filtering und trilinearem anisotropem Filtering auf einer GF3 zu benchen.
Bench-System
ASUS TUSL2-C, PIII-S Tualatin 1.26GHz (512K L2 Cache), 384MB PC133 SDRAM (CAS 2), nichts übertaktet
ASUS V8200 Pure GF3, 21.85, keine Tweaks
Serious Sam V1.4, "Quality" Presets, "optimal" Texturen (kein TC), 1024x768x32, kein V-Sync, kein FSAA, kein Sound
"Memphis Suburb" Timedemo
Ich habe Serious Sam genommen, weil dieses Spiel viele grössere Texturen aufweist. Ausserdem läuft das Timedemo nicht wie z.B. bei Q3A "verschnellert" durch, sondern in normalem Spiel-Tempo. Als letzten Grund möchte ich angeben, dass SS die Durchschnittswerte auch ohne exzessive Ausreisser anzeigt ("average without excessive peaks"), was zu sehr stabilen und vergleichbaren Durchschnittswerten führt. "Memphis Suburb" wurde wegen der grösseren Anzahl Texturen als z.B. bei "Dunes" genommen. Ausserdem wiederspiegelt dieses Demo recht gut eine typische Shooter-Szene. :)
Ich werde hier extra NICHT auf Vergleiche mit der Radeon8500 eingehen, da ich noch keinen Zugriff auf dieser Karte habe und daher auch nicht auf demselben System durchbenchen kann. Aufgrund der recht unterschiedlichen Implementation des Textur-Filterings bei NVIDIA und ATi ist es eh sinnlos, einfach nur Zahlen zu vergleichen und einen "Gewinner" zu suchen. Weil die Qualität von Texturfiltering vorallem in Bewegung ersichtlich wird, habe ich auch aufs Posten von Screenshots der entsprechenden AF-Settings verzichtet.
Als Vergleichswerte dienen averages without excessive peaks fps; ich verwende als Notation nicht "tap" wie das bei NVIDIA häufig der Fall ist, sondern beschränke mich auf die AF Stufen.
GF3, stock clock rates (200/230MHz)
Bilinear, no AF : 94
Bilinear, 2x AF : 93
Bilinear, 4x AF : 86
Bilinear, 8x AF : 73
Performance-Verlust von Bilinear no AF zu voller AF : -22%
Trilinear, no AF : 94
Trilinear, 2x AF : 89
Trilinear, 4x AF : 76
Trilinear, 8x AF : 62
Performance Verlust von Trilinear no AF zu voller AF : -35%
Als erstes fällt auf, dass ohne anisotropes Filtering Trilinear praktisch gratis zu haben ist, bei der GF3. Ich habe das noch mit den anderen Timedemos durchprobiert, und immer lag trilineares Filtering höchstens 1fps hinter dem bilinearen. Ohne AF reagierte SS auch kaum bis gar nicht auf Übertakten der Grafikkarte, aber dazu unten mehr.
Der Unterschied zwischen den Performance-Verlusten ist nicht unwesentlich (und deckt sich recht gut mit den Zahlen, die bei Reviews und Vergleichen häufig genannt werden--30 bis 40% für "64tap" anisotropes Filtering); IQ Unterschiede zwischen bilinear-8x-AF und trilinear-8x-AF sind zumindest bei Serious Sam und auf meinem System zu vernachlässigen: in Bewegung macht trilineares Filtering zwar einen noch etwas "schärferen" Eindruck, aber die gefürchteten MIP-map boundaries sind auch mit bilinearem Filtering nicht zu sehen und die Texturen auch auf weite Distanz scharf und unverzerrt. Ich könnte jedenfalls nicht ohne Vergleich "blind" erraten, ob jetzt trilinear oder bilinear anisotrop gefiltert wurde.
Um zu sehen, wie die GF3 skaliert, habe ich mal mit 10% Mehrtakt gebencht:
GF3, 220/255MHz
Ich beschränke mich hier auf die Extreme: "kein AF" und "höchstes AF".
Bilinear, no AF : 95
Bilinear, 8x AF : 80
Performance-Verlust von Bilinear no AF zu voller AF : -16%
Trilinear, no AF : 94
Trilinear, 8x AF : 68
Performance Verlust von Trilinear no AF zu voller AF : -28%
Man sieht hier schön, dass Texturfiltering gut von höheren Taktraten profitieren kann: die nicht-AF Werte haben sich trotz 10% höheren Taktes nicht geändert. Also ähnlich wie bei Razors FSAA Vergleich--übertakten bringt eigentlich nur was, wenn man auf Füllraten- und/oder Bandbreiten-intensive Features setzen will.
Was passiert nun, wenn man die GF3 auf Ti500-Niveau betreibt?
GF3, 240/250MHz
Auch hier nur die Extreme:
Bilinear, no AF : 94
Bilinear, 8x AF : 84
Performance-Verlust von Bilinear no AF zu voller AF : -11%
Trilinear, no AF : 94
Trilinear, 8x AF : 72
Performance Verlust von Trilinear no AF zu voller AF : -23%
Nicht schlecht--mit rund 10% Performance-Verlust lässt sich's eigentlich leben. Man bemerke, dass Texturfiltering mehr von einem höheren Chip- als von einem höheren RAM-Takt gewonnen hat--offenbar ist AF bei der GF3 nicht bandbreitenlimitiert, sondern stösst wie erwartet bei der Füllrate an Grenzen. Wieder schön zu sehen, wie die Default-Werte des Benchmarks kaum auf die geänderten Takte reagieren.
Mit aktivierter Textur-Kompression wird das Bild deutlich hässlicher (besonders der Himmel), jedoch beschränkt sich der Performance-Zuwachs bei voller anisotropen Filterung auf ein bis zwei fps (noch ein Hinweis darauf, dass die Bandbreite hier nicht wesentlich einschränkt).
Wie sich die Performance bei höheren O/clocks oder auch bei einer nicht-übertakteten GF3 Ti200 verhält, scheint klar. Schade, dass die GF3 nicht mit höherem Chiptakt als 240MHz ausgeliefert wird, jedoch wird sich eine Ti500 vielleicht stabil auf so was Schönem wie 280MHz betreiben lassen. Dann wäre bilineares AF bei vielen Spielen echt schon fast gratis zu haben (so es sich denn aktivieren lässt).
Wie immer: die Ergebnisse, die ich hier veröffentliche, beziehen sich ausschliesslich auf die oben genannte Konfiguration von System und Spiel; meine Schlussfolgerungen sind genau das: MEINE Schlussfolgerungen, und daher offen zur Diskussion (oder auch flamen, wenn jemand auf sowas steht).
OK, soviel von mir; Kommentare und Korrekturen sind natürlich gerne willkommen. Ich geh' jetzt erstmals spielen, denn darum geht's doch eigentlich. :D
ta,
-Sascha.rb
angeregt durch die verschiedenen Artikel zu den neuen Radeon8500er Treibern auf dem Netz und Xmass Post im Beyond3D Forum (hier: http://bbs.pcstats.com/beyond3d/messageview.cfm?catid=3&threadid=1331) habe ich mich mal hingesetzt, um die Unterschiede zwischen bilinearem anisotropem Filtering und trilinearem anisotropem Filtering auf einer GF3 zu benchen.
Bench-System
ASUS TUSL2-C, PIII-S Tualatin 1.26GHz (512K L2 Cache), 384MB PC133 SDRAM (CAS 2), nichts übertaktet
ASUS V8200 Pure GF3, 21.85, keine Tweaks
Serious Sam V1.4, "Quality" Presets, "optimal" Texturen (kein TC), 1024x768x32, kein V-Sync, kein FSAA, kein Sound
"Memphis Suburb" Timedemo
Ich habe Serious Sam genommen, weil dieses Spiel viele grössere Texturen aufweist. Ausserdem läuft das Timedemo nicht wie z.B. bei Q3A "verschnellert" durch, sondern in normalem Spiel-Tempo. Als letzten Grund möchte ich angeben, dass SS die Durchschnittswerte auch ohne exzessive Ausreisser anzeigt ("average without excessive peaks"), was zu sehr stabilen und vergleichbaren Durchschnittswerten führt. "Memphis Suburb" wurde wegen der grösseren Anzahl Texturen als z.B. bei "Dunes" genommen. Ausserdem wiederspiegelt dieses Demo recht gut eine typische Shooter-Szene. :)
Ich werde hier extra NICHT auf Vergleiche mit der Radeon8500 eingehen, da ich noch keinen Zugriff auf dieser Karte habe und daher auch nicht auf demselben System durchbenchen kann. Aufgrund der recht unterschiedlichen Implementation des Textur-Filterings bei NVIDIA und ATi ist es eh sinnlos, einfach nur Zahlen zu vergleichen und einen "Gewinner" zu suchen. Weil die Qualität von Texturfiltering vorallem in Bewegung ersichtlich wird, habe ich auch aufs Posten von Screenshots der entsprechenden AF-Settings verzichtet.
Als Vergleichswerte dienen averages without excessive peaks fps; ich verwende als Notation nicht "tap" wie das bei NVIDIA häufig der Fall ist, sondern beschränke mich auf die AF Stufen.
GF3, stock clock rates (200/230MHz)
Bilinear, no AF : 94
Bilinear, 2x AF : 93
Bilinear, 4x AF : 86
Bilinear, 8x AF : 73
Performance-Verlust von Bilinear no AF zu voller AF : -22%
Trilinear, no AF : 94
Trilinear, 2x AF : 89
Trilinear, 4x AF : 76
Trilinear, 8x AF : 62
Performance Verlust von Trilinear no AF zu voller AF : -35%
Als erstes fällt auf, dass ohne anisotropes Filtering Trilinear praktisch gratis zu haben ist, bei der GF3. Ich habe das noch mit den anderen Timedemos durchprobiert, und immer lag trilineares Filtering höchstens 1fps hinter dem bilinearen. Ohne AF reagierte SS auch kaum bis gar nicht auf Übertakten der Grafikkarte, aber dazu unten mehr.
Der Unterschied zwischen den Performance-Verlusten ist nicht unwesentlich (und deckt sich recht gut mit den Zahlen, die bei Reviews und Vergleichen häufig genannt werden--30 bis 40% für "64tap" anisotropes Filtering); IQ Unterschiede zwischen bilinear-8x-AF und trilinear-8x-AF sind zumindest bei Serious Sam und auf meinem System zu vernachlässigen: in Bewegung macht trilineares Filtering zwar einen noch etwas "schärferen" Eindruck, aber die gefürchteten MIP-map boundaries sind auch mit bilinearem Filtering nicht zu sehen und die Texturen auch auf weite Distanz scharf und unverzerrt. Ich könnte jedenfalls nicht ohne Vergleich "blind" erraten, ob jetzt trilinear oder bilinear anisotrop gefiltert wurde.
Um zu sehen, wie die GF3 skaliert, habe ich mal mit 10% Mehrtakt gebencht:
GF3, 220/255MHz
Ich beschränke mich hier auf die Extreme: "kein AF" und "höchstes AF".
Bilinear, no AF : 95
Bilinear, 8x AF : 80
Performance-Verlust von Bilinear no AF zu voller AF : -16%
Trilinear, no AF : 94
Trilinear, 8x AF : 68
Performance Verlust von Trilinear no AF zu voller AF : -28%
Man sieht hier schön, dass Texturfiltering gut von höheren Taktraten profitieren kann: die nicht-AF Werte haben sich trotz 10% höheren Taktes nicht geändert. Also ähnlich wie bei Razors FSAA Vergleich--übertakten bringt eigentlich nur was, wenn man auf Füllraten- und/oder Bandbreiten-intensive Features setzen will.
Was passiert nun, wenn man die GF3 auf Ti500-Niveau betreibt?
GF3, 240/250MHz
Auch hier nur die Extreme:
Bilinear, no AF : 94
Bilinear, 8x AF : 84
Performance-Verlust von Bilinear no AF zu voller AF : -11%
Trilinear, no AF : 94
Trilinear, 8x AF : 72
Performance Verlust von Trilinear no AF zu voller AF : -23%
Nicht schlecht--mit rund 10% Performance-Verlust lässt sich's eigentlich leben. Man bemerke, dass Texturfiltering mehr von einem höheren Chip- als von einem höheren RAM-Takt gewonnen hat--offenbar ist AF bei der GF3 nicht bandbreitenlimitiert, sondern stösst wie erwartet bei der Füllrate an Grenzen. Wieder schön zu sehen, wie die Default-Werte des Benchmarks kaum auf die geänderten Takte reagieren.
Mit aktivierter Textur-Kompression wird das Bild deutlich hässlicher (besonders der Himmel), jedoch beschränkt sich der Performance-Zuwachs bei voller anisotropen Filterung auf ein bis zwei fps (noch ein Hinweis darauf, dass die Bandbreite hier nicht wesentlich einschränkt).
Wie sich die Performance bei höheren O/clocks oder auch bei einer nicht-übertakteten GF3 Ti200 verhält, scheint klar. Schade, dass die GF3 nicht mit höherem Chiptakt als 240MHz ausgeliefert wird, jedoch wird sich eine Ti500 vielleicht stabil auf so was Schönem wie 280MHz betreiben lassen. Dann wäre bilineares AF bei vielen Spielen echt schon fast gratis zu haben (so es sich denn aktivieren lässt).
Wie immer: die Ergebnisse, die ich hier veröffentliche, beziehen sich ausschliesslich auf die oben genannte Konfiguration von System und Spiel; meine Schlussfolgerungen sind genau das: MEINE Schlussfolgerungen, und daher offen zur Diskussion (oder auch flamen, wenn jemand auf sowas steht).
OK, soviel von mir; Kommentare und Korrekturen sind natürlich gerne willkommen. Ich geh' jetzt erstmals spielen, denn darum geht's doch eigentlich. :D
ta,
-Sascha.rb