PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Leistungseinbruch beim AF


Quasar
2004-01-02, 16:04:50
Da IMO in letzter Zeit wieder zunehmend die Tendenz zu beobachten ist, ATis AF als "schneller, aber nicht wahrnehmbar schlechter" als das der Konkurrenz darzustellen, hab ich nochmal eine kleine Testreihe gemacht, obwohl es vielen sicherlich auch so bewußt ist.

Grundlage war dabei der Villagemark von PowerVR in Version 1.20 mit einer von Cat3.10 angetriebenen Radeon9800p (380/340). Wenn es interessiert - das geschah auf einem P4-3,0c, i875, DC-DDR400@2-3-3-5, WinXP, DX9.0b.

Gemessen wurde per CL-Option "-benchmark=1" die erreichte Framerate in einer Auflösung von 1600x1200x32 bei 75Hz, das sollte genügend äußere Faktoren ausschließen, um einen brauchbaren Füllratentest abzugeben.
Da es hier einzig um den R300/350 geht, fallen die Unterschied im HSR verschiedener Chips schonmal weg und behindern auch nicht die Aussagekraft der Ergebnisse.



Angegeben ist das Leistungsniveau in Relation zum Startwert
Full-tri TS-tri Bi-AF
kein AF 100%
2xAF 73% 91% 99%
max. 4xAF 66% 78% 82%
max. 8xAF 60% 72% 74%
max. 16xAF 55% 67% 70%
edit: auch hier beziehen sich die Leistungsangaben auf
den Wert bei keinem AF voller trilinearer Filterung.

Der VillageMark verwendet 3 Texturschichten und hat eine, um es mal freundlich zu sagen, recht übersichtliche Geometrie.
Der Vorteil ist, daß hier die Winkelabhängigkeit des ATi-AF nur sehr begrenzt zum Einsatz kommt, da der Boden absolut eben ist und man 'sich' die meiste Zeit zwischen zwei 90°-Hauswänden bewegt.



Anhand der Ergebnisse sieht man, daß auch ATi nur mit Wasser kocht und bei Geometrie, die die Winkelabhängigkeit kaum zum Zuge kommen läßt, keinesfalls AF-for-free bietet, wie gern behauptet.
In Spielen stellt sich das Ganze durchaus unterschiedlich dar, es gibt weitaus mehr limitierende Faktoren, die den Einsatz von AF schmackhafter machen und auch den Leistungsverlust erträglicher gestalten - dazu zählen u.a. Limitierungen durch die CPU oder eben eine Geometrie, die größeres Optimierungspotenzial bietet.

Umsonst jedoch ist in diesem Leben gar nichts - sogar der Tod kostet das Leben.

P.S.:
Vielleicht kommen nachher noch FX5900-Werte dazu.
edit:
So, es ist vollbracht. Um den Einfluß (und die Meckerei) von/über die reduziert-trilineare Filterung in neueren Treibern möglichst gering zu halten, habe ich mir mal erlaubt, den WHQL-44.03 Detonator zu verwenden.
Ansonsten war bis auf eine mit 450/425MHz taktende nV35 eigentlich alles gleich wie oben.

Angegeben ist das Leistungsniveau in Relation zum Startwert
Quality Perf. High-Perf.
kein AF 100%
2xAF 70% 79% 87%
(max).4xAF 61% 64% 71%
max. 8xAF 54% 57% 63%
max. 16xAF ./. ./. ./.

Eine kleine Anmerkung noch: Die Angaben unter Performance und High Performance beziehen sich auf die mit ohne AF erreichte Leistung bei trilinearer Filterung, obwohl AF hier mit teils drastisch reduzierter Qualität (High Performance) und Anteil an trilinearer Filterung (Performance & High Performance) auskommen muss, allerdings in keinem Falle eine TS-Optimierung enthält.


edit2:
Auf Wunsch von Lovesuckz dasselbe nochmal mit den offiziellen WHQL-53.03 ForceWare Treibern.

Angegeben ist das Leistungsniveau in Relation zum Startwert
Quality Perf. High-Perf.
kein AF 100%
2xAF 69% 76% 95%
(max).4xAF 69% 71% 96%(!)
max. 8xAF 65% 68% 91%
max. 16xAF ./. ./. ./.

Anmerkungen:
Der VM unterstützt kein App-AF, also sämtliche Einstellungen per Treiber bzw. aTuner erzwungen.
Quality: reduziert-trilineare Filterung über alle AF-Stufen und Textur-Stages. Bei 2xAF zusätzlich stark reduzierter Tri-Anteil auf allen Stages >0.
Performance: Reines bilineares AF, ohne Tri-Anteil, alle AF-Stufen, alle Stages.
High-Performance: Wie Performance, aber zus. bei 2xAF auf allen Stages >0 kein AF

aths
2004-01-02, 16:36:57
NV35-Werte wären im Vergleich sehr interessant.

DrumDub
2004-01-02, 16:51:18
die ts-"optimierung" macht also 12-18% leistung aus. interessant.

Quasar
2004-01-02, 16:53:25
Original geschrieben von aths
NV35-Werte wären im Vergleich sehr interessant.
Sind in Arbeit.

Done

ow
2004-01-02, 17:16:03
.

Quasar
2004-01-02, 17:26:09
Original geschrieben von ow
Reine Bi-Werte würden mich noch interessieren um den Leistungsabfall von Bi auf Tri festzustellen.
Bitte sehr...

Original geschrieben von ow
Wenn du den R300 auf Tri mit 100% festsetzt, dann schätze ich mal, dass Bi auf etwa 125% kommt.

Ohne AF hast du dich etwas verschätzt.
Es sind _über_ 50%, 90fps mit trilinearer Filterung und 136fps mit bilinearer Filterung. (Ok, der eine Frame kann auch gut innerhalb der Rundungsdifferenz liegen, auf jeden Fall skaliert die Füllrate 1:2 von bi zu tri herunter.) ;)

betasilie
2004-01-02, 17:26:15
Original geschrieben von ow
Reine Bi-Werte würden mich noch interessieren um den Leistungsabfall von Bi auf Tri festzustellen.


Das würde mich auch interessieren. ... Ansonsten sehr interessant. :up:

Edit:
Hast Du gerade reingemacht.

Das sieht man mal wieviel Bi das eigentliche Treiber-Tri-AF ist.

aths
2004-01-02, 17:32:36
Original geschrieben von Quasar
(Ok, der eine Frame kann auch gut innerhalb der Rundungsdifferenz liegen, auf jeden Fall skaliert die Füllrate 1:2 von bi zu tri herunter.) ;) So und nicht anders sollte es bei Füllratenlimitierung auch sein.

Wie R300 vs. NV35 zeigt, bringt 2x AF fast den gleichen Verlust. Kein Wunder, wenn man die Muster betrachtet. Die Schere geht mit höheren Graden weiter auseinander. Kein Wunder, wenn man die Muster betrachtet.

DrumDub
2004-01-02, 17:32:44
noch interessanter: der unterschied zwischen nv35 (ultra) und r3x0 beträgt also nur 1-3% bei voller trilinearer filterung. insofern scheint das sparen der transistoren durch die winkelabhängigkeit keinen all zu großen einfluss auf die performance zu haben.* vielmehr ist es die ts-optimierung, die ati den größten vorteil beim af bringt.

* natürlich sähe es taktbereinigt wieder anders aus.

LovesuckZ
2004-01-02, 17:33:56
Koenntest du auch mal mit dem 53.03 testen?

LovesuckZ
2004-01-02, 17:35:15
Original geschrieben von DrumDub
noch interessanter: der unterschied zwischen nv35 (ultra) und r3x0 beträgt also nur 1-3% bei voller trilinearer filterung. insofern scheint das sparen der transistoren durch die winkelabhängigkeit keinen all zu großen einfluss auf die performance zu haben[...]

Ich zitiere:
Der Vorteil ist, daß hier die Winkelabhängigkeit des ATi-AF nur sehr begrenzt zum Einsatz kommt, da der Boden absolut eben ist und man 'sich' die meiste Zeit zwischen zwei 90°-Hauswänden bewegt.

aths
2004-01-02, 17:35:28
Original geschrieben von DrumDub
noch interessanter: der unterschied zwischen nv35 (ultra) und r3x0 beträgt also nur 1-3% bei voller trilinearer filterung. insofern scheint das sparen der transistoren durch die winkelabhängigkeit keinen all zu großen einfluss auf die performance zu haben.* Doch, weil damit Füllrate spart. Je höher der AF-Grad, desto größer die Differenz. Durch bi erhält man natürlich auf Kosten der Qualität noch mal ordentlich Geschwindigkeit. Aber bilineare Filterung bei einem Chip solchen Kalibers — meine Ansicht hierzu ist ja bekannt http://www.aths.net/files/smilies/smile.gif

Demirug
2004-01-02, 17:44:09
Was man unter Umständen einmal Untersuchen sollte ist ob es unterschiedliches Verhalten gibt bezüglich der direkten Draufsicht auf eine Fläche im bezug zur Entfernung. Also bei welcher Entfernung die Mipmap gewechselt wird.

DrumDub
2004-01-02, 17:46:40
Original geschrieben von aths
Doch, weil damit Füllrate spart. Je höher der AF-Grad, desto größer die Differenz. Durch bi erhält man natürlich auf Kosten der Qualität noch mal ordentlich Geschwindigkeit. Aber bilineare Filterung bei einem Chip solchen Kalibers — meine Ansicht hierzu ist ja bekannt http://www.aths.net/files/smilies/smile.gif

hast recht. bin in der zeile verrutscht (8xaf<->16xaf).

bei 2xaf sind 3% bei 4xaf 5% und bei 8xaf 6%.

lovesuckz

stimmt das war ja der sinn der vergleichbarkeit von quasars test. hab nicht bedacht, dass die im spiel/benchmark vorhandenen winkel auch direkt die filterung beeinflussen.

Quasar
2004-01-02, 18:52:38
Original geschrieben von LovesuckZ
Koenntest du auch mal mit dem 53.03 testen?

Done.

Demirug
2004-01-02, 19:17:12
Wer mal Lust und Laune hat kann mal folgendes ausprobieren.

Meinen AFTester nehmen. Diesen auf "Plane" und Mipmap = Point stellen. Dann am Distance Regeler rumschieben bis der Farbumschlag kommt. Man könnte das auch mit Trilinear machen aber da sieht man den Umschlag nicht so deutlich.

NV34 53.03:


1 2 3 4 5
noAF 3.1 6.2 12.4 24.7 49.4
2xAF 6.2 12.4 24.7 49.4
4xAF 12.4 24.7 49.4
8xAF 24.7 49.4

Gast
2004-01-02, 19:40:38
Villagemark D3D 1.19, 1024x768x32

Athlon 1.300 MHz, 512 MB, W98SE, Radeon 9700-NonPro, Cat. 3.10


No Antialiasing 2x Antialiasing
TS TS
0 155 129
2xbi 154 128
2xtri 106 135 93 112
4xbi 116 99
4xtri 83 101 75 88
8xbi 103 90
8xtri 76 91 68 80
16xbi 94 83
16xtri 70 84 63 74

Gast
2004-01-02, 20:05:23
Nachtrag: Ich habe den Leistungseinbruch zwischne 2xTri und 4xTri auch unter Codecreatures getestet, wieder in 1024x768. TS und 2xAA waren aktiviert (wie auch beim richtigen Spielen, also gewissermaßen "praxisbezogen"):avg fps 20 18,8
max fps 31 25
avg pol 6,9 6,8
max pol 11,8 11,4
frames 2633 2471
Grass
avg fps 23,1 20,1
max fps 31 25
Water
avg fps 17,5 17,8
max fps 22 23

LovesuckZ
2004-01-02, 21:46:18
Original geschrieben von Quasar
Done.

Allgemein:
Nun, woher stammt dann der Leistungszuwachs?

Mr. Lolman
2004-01-03, 13:25:37
Original geschrieben von Quasar
Da IMO in letzter Zeit wieder zunehmend die Tendenz zu beobachten ist, ATis AF als "schneller, aber nicht wahrnehmbar schlechter" als das der Konkurrenz darzustellen, hab ich nochmal eine kleine Testreihe gemacht, obwohl es vielen sicherlich auch so bewußt ist.



Ich hab mal einige Spiele durchgetestet. ATis 8xbi AF reicht eistens aus um schöne Grafik zu bekommen - wie auch beim Villagemarkdemo (einzig und allein bei dein Dächern sieht man im Demo Modus einmal ein Mipmapbanding)


Der Leistungseinbruch in 1152x864 beim Aktivieren von 8xbi-AF liegt zw. 0 und 10%. Benches folgen gegen Abend.

Endorphine
2004-01-03, 13:49:43
Original geschrieben von Mr. Lolman
Ich hab mal einige Spiele durchgetestet. ATis 8xbi AF reicht eistens aus um schöne Grafik zu bekommen [...] :eyes: Das ist eine Meinung, kein Fakt.

LovesuckZ
2004-01-03, 18:23:38
Kurz eine kleine Offtopicfrage:
Es ist ja bekannt, dass Nvidia beim Einsatz von AF unter D3D doch ziemlich viel Leistung verliert, hat dafür einer schon eine Erklaerung?
ich mein, es ist ja normal, dass die karten von den "vollwertigen" r3xx Karten abgehaengt werden, aber warum passieren dann aber in vielen Spiele diese deutlichen Performanceprobleme, wie sie zum Beispiel unter Aquanox2, UT2003 (bestimmte Maps), FI99-02 etc auftreten und die Karten sich nur knapp vor den 9600XT schlagen?

Mr. Lolman
2004-01-03, 18:50:36
Womöglich gibts in jenen Spielen mehr "günstige" Winkel für ATis, so dass sich dort deren Performanceeinbrauch beim AF verhältnismässig schwach bemerkbar macht. Da ja Quasar mit dem Villagemarkdemo zeigte, dass bei nahezu volle Filterturung (geringe Relevanz der Winkelabhängigket) die ATis das schnellere AF "Quality" bieten :ratlos:

Gast
2004-01-03, 19:40:36
Man sollte auch bedenken, dass die Differenz zwischen reinem TriAF und Stage0 TriAF um so größer wird umso mehr Texture Layer ein Game benutzt, zumindest auf die Fillrate bezogen.

D.h. die aufgezeigten prozentualen Unterschiede sind nicht allgemein gültig.