PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Diskussion zum Artikel "GeForceFX Anti-Aliasing auf GeForce3 und 4"


Leonidas
2002-11-24, 23:49:16
Hier isser. (http://www.3dcenter.org/artikel/2002/11-24_a.php)



Den dafür benötigten aTuner gibt es hier (http://www.3dcenter.org/atuner/).



/edit 25.11. 18:46
Update mittels eines Abschnitts über die bei 8x reduzierte 16-Bit-Rasterung bei 16-Bit-Spielen. Gleichzeitig wurden ein Teil der dritten Seite auf die zweite Seite verschoben, damit die Seiten wieder in etwa gleich lang sind.

Exxtreme
2002-11-24, 23:58:32
Guter Artikel.

mapel110
2002-11-25, 03:05:46
jup, guter artikel.

mich würde noch die performance bei der quake3-engine(quake3 im speziellen) interessieren.
sollte imo fast spielbar sein.

FormatC
2002-11-25, 03:14:30
Originally posted by mapel110
jup, guter artikel.

mich würde noch die performance bei der quake3-engine(quake3 im speziellen) interessieren.
sollte imo fast spielbar sein.

Die ist wie auch zuvor schon. ;)

Leonidas
2002-11-25, 07:55:36
Originally posted by mapel110
jup, guter artikel.

mich würde noch die performance bei der quake3-engine(quake3 im speziellen) interessieren.
sollte imo fast spielbar sein.



Unter OpenGL gibt es diese neuen Modi derzeit für die GeForce 3/4 nicht (fehlt in den Treibern).

aths
2002-11-25, 09:15:04
Ich hatte mich bemüht, nicht nochmal die ganze FSAA-Theorie durchzukauen. Es dürfte auch aufgefallen sein, dass ich bei der Bewertung der Modi lieber habe Screenshots sprechen lassen, als eine Beurteilung in eigenen Worten abzugeben.

Der Grund ist: Im Prinzip ist 8xS = 2x2 "Strohdumm-Supersampling" [TM of Zeckensack] halt mit 2x RG Multisampling kombiniert. Durch den hohen "Strohdumm"-Anteil ist die Qualität für die dermaßen stark verminderte Leistung sogar ziemlich schlecht, daran wird sich imo auch bei GFFX nicht wirklich viel ändern.

Unabhängig von der Leistung hingegen ist die Qualität natürlich sehr gut - Voodoo5 lässt grüßen. Allerdings erinnert auch die Performance an Voodoo5 mit 4x FSAA, und hohe Framerate ist ja ein sehr wichtiges Merkmal guter Grafik. (In der Realität ruckelt es ja auch nicht.) Ich bin aber sehr froh, endlich 8xS zu haben - wünschen tu ich mir das ja seit ca. einem dreiviertel Jahr :)

Mit 6xS kann ich wegen dem auftretendem Raster-Effekt weniger anfangen. Auch wenn man zwischen 4xS (zumindest auf GeForce4 Ti durchaus brauchbar) und 8xS (fordert auch einer Ti 4600 alles ab) gerne noch eine Zwischenstufe hätte, so halte ich 6xS für relativ unnütz.

Ikon@school
2002-11-25, 12:49:13
Soll jetzt kein Flame sein, aber ich muss sagen, da hätte ich mehr von NV erwartet (als "Strohdumm-Supersampling" [TM of Zeckensack] mit altbackenem GF3-2xRG-MSAA). Speedmäßig wird das wohl nichts so der Hammer und spätestens wenn das Teil etwas "älter" ist, wird man wohl wieder auf 2xAA runtergehen müssen.

Ich weiß, ist nichts neues, aber jetzt kann man es wohl als relativ sicher betrachten, dass die GFFX "nur" diese neuen AA-Modi mitbringt.

<Spekualtions-Mode>
Es besteht allerdings noch die Möglichkeit, dass ev. andere (MSAA-)Modi von der GFFX beherrscht werden, die noch nicht im Detonator eingebaut sind.
</Spekulationsmode>

Who knows ??? ... aber ich glaub's nicht mehr.

Unreal Soldier
2002-11-25, 12:55:09
Guter Artikel

AlfredENeumann
2002-11-25, 12:59:20
Hallo aths,

kannst du mir mal sagen jetzt rein von der Qualität her man das SS 2x,4x und 6x der R200 einordnen müßte gemessen an den Nvidia Modi. Denn wenn man jetzt von der Quali annähernd vergleichbare AA-Technik auf der GF3/4 hat kann man doch jetzt mal einen dirketen Geschwindigkeitsvergleich machen ohne Äpfel mit Birnen vergleichen zu müssen.

aths
2002-11-25, 13:42:59
Originally posted by AlfredENeumann
Hallo aths,

kannst du mir mal sagen jetzt rein von der Qualität her man das SS 2x,4x und 6x der R200 einordnen müßte gemessen an den Nvidia Modi. Denn wenn man jetzt von der Quali annähernd vergleichbare AA-Technik auf der GF3/4 hat kann man doch jetzt mal einen dirketen Geschwindigkeitsvergleich machen ohne Äpfel mit Birnen vergleichen zu müssen.
Das ist leider nicht so einfach zu beantworten. Sofort vergleichen kann man 2x vs. 2x.

Ich gehe erst mal davon aus, dass Radeon Multisampling macht.

8x (GFFX) müsste gegen 4x + 2x AF (9700) antreten. Wobei der 8x-Modus halt auch AlphaTesting-Kanten ganz gut glättet, was man von 4x + 2x AF nicht behaupten kann. Das müsste dann von Spiel zu Spiel mit Screenshots entschieden werden. Insgesamt würde 8xS also das bessere Bild liefern. (Ausnahme, wenn das Spiel Probleme mit Oversampling haben sollte.)

Mit Bauchschmerzen könnte man auch 4xS (NV) vs. 4x RG (ATI) vergleichen. ATI bietet dabei bessere Kanten, NV bessere Texturen, insgesamt sollte ATI hier aber das bessere Bild liefern.

Außer 2x vs. 2x sind alle Vergleiche wie Vergleiche zwischen Äpfel und Birnen zu betrachten.


Beim Supersampling auf der Radeon steht die Frage, ob dort noch das gute Raster genommen werden kann, oder Oversampling gemacht werden muss. Solange das unklar ist, halte ich die Aufstellung von Vergleichen für wenig sinnvoll.

aths
2002-11-25, 13:50:15
Originally posted by Ikon@school
ich muss sagen, da hätte ich mehr von NV erwartet (als "Strohdumm-Supersampling" [TM of Zeckensack] mit altbackenem GF3-2xRG-MSAA).Ich bin auch sehr enttäuscht. Vermutlich wähnte sich NV beim Design des NV30 noch sehr sicher und rechnete nicht mit einem baldigem Erstarken ATIs, und beließen es deshalb bei HRAA.

ow
2002-11-25, 13:54:41
@aths

AEN bezog sich auf das AA der R8500 aka R200 und nicht der R9700.

StefanV
2002-11-25, 14:33:09
Originally posted by aths
Das ist leider nicht so einfach zu beantworten. Sofort vergleichen kann man 2x vs. 2x.

Ich gehe erst mal davon aus, dass Radeon Multisampling macht.


R200-> 8500 ;)

Bei der soll MSAA geplant gewesen sein, aber nicht so recht gefunzt haben.

Ergo:

SSAA

zeckensack
2002-11-25, 14:39:21
Originally posted by Stefan Payne


R200-> 8500 ;)

Bei der soll MSAA geplant gewesen sein, aber nicht so recht gefunzt haben.

Ergo:

SSAA Meinst ???

Also was tatsächlich geplant war, aber nicht gefunzt hat, waren die programmierbaren 'intelligenten' Subpixelanordnungen, die man in frühen Reviews der Karte bewundern kann.

Unregistered
2002-11-25, 14:53:17
Originally posted by aths
Der Grund ist: Im Prinzip ist 8xS = 2x2 "Strohdumm-Supersampling" [TM of Zeckensack] halt mit 2x RG Multisampling kombiniert. Durch den hohen "Strohdumm"-Anteil ist die Qualität für die dermaßen stark verminderte Leistung sogar ziemlich schlecht, daran wird sich imo auch bei GFFX nicht wirklich viel ändern.


Glaubst du wirklich, das sich beim GFfx nicht viel ändern wird? Schließlich ist die GFfx auf 4xMSAA optimiert.
Da würde es doch Sinn machen, (zumindest) die 6xS und 8x - Modes entsprechend anzupassen, um eine höhere fps-Leistung bei geringfügig schlechterer IQ zu erreichen.

Der 8x-Mode sieht ja imho "ganz gut" aus, aber ein Einbruch von über 80% bei der Framerate ist schon _sehr_ extrem. Selbst die GFfx wird oft nur noch unspielbare Frameraten abliefern bei dem Mode.

mapel110
2002-11-25, 15:25:39
Originally posted by Leonidas




Unter OpenGL gibt es diese neuen Modi derzeit für die GeForce 3/4 nicht (fehlt in den Treibern).

is mir erst jetzt (nach dem schlafen ) wieder eingefallen. man sollte wohl doch nicht nach 3:00 nachts posten ;)
*augenreib*

wrdaniel
2002-11-25, 15:50:40
schoener artikel! hab' ich natuerlich auch gleich mal mit meiner GF3 testen muessen, und mit vampires bei 8AA/8AF laeuft alles wunderbar. sieht jedenfalls gut aus, ob es jetzt wirklich 8AA ist weis ich net. aber es geht nichts ueber schoene alte games. hat uebrigens ne sehr solide engine finde ich. hab mal nen shot gemacht falls es sich jemand anschaun moechte.

http://wrdaniel.de/vampire.bmp

aths
2002-11-25, 15:57:41
Originally posted by ow
@aths

AEN bezog sich auf das AA der R8500 aka R200 und nicht der R9700. Hab ich wieder nicht genau gelesen?! :nono:, aths!


AEN,

mit R200 ist das FSAA schwierig zu zu vergleichen. In D3D *sollte* eigentlich ein RG-Muster zum Einsatz kommen. Ob dem noch immer so ist, würde ich gerne überprüfen. WENN dem so ist, kann man 4x mit 8xS vergleichen. Wenn dem nicht so ist, ist selbst 6x nicht so gut wie 4xS.

aths
2002-11-25, 16:00:13
Originally posted by Unregistered
Glaubst du wirklich, das sich beim GFfx nicht viel ändern wird? Schließlich ist die GFfx auf 4xMSAA optimiert.
Da würde es doch Sinn machen, (zumindest) die 6xS und 8x - Modes entsprechend anzupassen, um eine höhere fps-Leistung bei geringfügig schlechterer IQ zu erreichen.

Der 8x-Mode sieht ja imho "ganz gut" aus, aber ein Einbruch von über 80% bei der Framerate ist schon _sehr_ extrem. Selbst die GFfx wird oft nur noch unspielbare Frameraten abliefern bei dem Mode. Mit 4x OG MS lassen sich kaum sinnvolle Modi basteln. Da kann 4x MS noch so schnell sein, es sieht kaum besser aus als wenn man 2x MS verwendet. Würde man auf der Basis von 4x OG MS und OG SS einen 6x und einen 8x-Modus basteln, sähen diese erheblich schlechter aus als das was im Moment geboten wird.

aths
2002-11-25, 16:02:32
Originally posted by wrdaniel
schoener artikel! hab' ich natuerlich auch gleich mal mit meiner GF3 testen muessen, und mit vampires bei 8AA/8AF laeuft alles wunderbar. sieht jedenfalls gut aus, ob es jetzt wirklich 8AA ist weis ich net. aber es geht nichts ueber schoene alte games. hat uebrigens ne sehr solide engine finde ich. hab mal nen shot gemacht falls es sich jemand anschaun moechte.

http://wrdaniel.de/vampire.bmp Jopp, das ist 8xS.

ow
2002-11-25, 16:44:25
Originally posted by aths
Hab ich wieder nicht genau gelesen?! :nono:, aths!


AEN,

mit R200 ist das FSAA schwierig zu zu vergleichen. In D3D *sollte* eigentlich ein RG-Muster zum Einsatz kommen. Ob dem noch immer so ist, würde ich gerne überprüfen. WENN dem so ist, kann man 4x mit 8xS vergleichen. Wenn dem nicht so ist, ist selbst 6x nicht so gut wie 4xS.


Dem duerfte NICHT so sein. AFAIK sind alles OG-Muster.

Leonidas
2002-11-25, 16:47:43
Originally posted by Ikon@school
Soll jetzt kein Flame sein, aber ich muss sagen, da hätte ich mehr von NV erwartet (als "Strohdumm-Supersampling" [TM of Zeckensack] mit altbackenem GF3-2xRG-MSAA). Speedmäßig wird das wohl nichts so der Hammer und spätestens wenn das Teil etwas "älter" ist, wird man wohl wieder auf 2xAA runtergehen müssen.




Abwarten. Über den Speed auf der GeForceFX lässt sich derzeit nur spekulieren, insofern wäre ich da vorsichtig.

Leonidas
2002-11-25, 16:49:24
Originally posted by wrdaniel
schoener artikel! hab' ich natuerlich auch gleich mal mit meiner GF3 testen muessen, und mit vampires bei 8AA/8AF laeuft alles wunderbar. sieht jedenfalls gut aus, ob es jetzt wirklich 8AA ist weis ich net. aber es geht nichts ueber schoene alte games. hat uebrigens ne sehr solide engine finde ich. hab mal nen shot gemacht falls es sich jemand anschaun moechte.

http://wrdaniel.de/vampire.bmp

Stimmt natürlich. Für uralt-Games kann man das problemlos einsetzen. Der 8x Modus ist auch auf der GF3/4 nicht sinnlos.

aths
2002-11-25, 17:01:10
Originally posted by ow
Dem duerfte NICHT so sein. AFAIK sind alles OG-Muster. Ich meine da mal Bilder gesehen zu haben, die ein RG-Muster nachwiesen ließen. Und zwar in D3D, wenn kein Fogging aktiviert ist.

Axel
2002-11-25, 17:53:47
Ein gut zu lesender Artikel.
Es wäre schön, wenn du vollständigkeitshalber die Qualität des AA einer Parhelia mit einordnen würdest. Das würde das Gesamtbild abrunden.
Diese verschiedenen Modi die jeder Hersteller angibt, sind ja nicht so richtig vergleichbar. Vielleicht kannst du eine Rangliste erstellen, die die Qulität der verschiedenen Methoden abbildet.

Exxtreme
2002-11-25, 18:04:46
Originally posted by ow
Dem duerfte NICHT so sein. AFAIK sind alles OG-Muster.
Es stimmt nur wenn Fog im Spiel aktiviert ist. Ohne Fog nutzt die R200 RGSSAA.

aths
2002-11-25, 18:23:55
Habe Leo noch eine kleine Ergänzung geschickt, um auf die 16-Bit-Qualität von 8xS näher einzugehen. (Um die Rasterung zu unterdrücken ist 8xS sehr gut geeignet.)

Desti
2002-11-25, 18:24:50
hmm...bei dem Morrobigshot bekomm ich oben so nette Fehlermeldungen :)

Warning: Cannot add header information - headers already sent by (output started at /homepages/6/d68770829/htdocs/artikel/2002/11-24_pic4.php:1) in /homepages/6/d68770829/htdocs/admin/shared.php on line 181

Warning: Cannot add header information - headers already sent by (output started at /homepages/6/d68770829/htdocs/artikel/2002/11-24_pic4.php:1) in /homepages/6/d68770829/htdocs/admin/shared.php on line 182

Warning: Cannot add header information - headers already sent by (output started at /homepages/6/d68770829/htdocs/artikel/2002/11-24_pic4.php:1) in /homepages/6/d68770829/htdocs/admin/shared.php on line 183

Warning: Cannot add header information - headers already sent by (output started at /homepages/6/d68770829/htdocs/artikel/2002/11-24_pic4.php:1) in /homepages/6/d68770829/htdocs/admin/shared.php on line 184

Warning: Cannot add header information - headers already sent by (output started at /homepages/6/d68770829/htdocs/artikel/2002/11-24_pic4.php:1) in /homepages/6/d68770829/htdocs/admin/shared.php on line 185

aths
2002-11-25, 18:29:33
Originally posted by Axel
Ein gut zu lesender Artikel.
Es wäre schön, wenn du vollständigkeitshalber die Qualität des AA einer Parhelia mit einordnen würdest. Das würde das Gesamtbild abrunden.
Diese verschiedenen Modi die jeder Hersteller angibt, sind ja nicht so richtig vergleichbar. Vielleicht kannst du eine Rangliste erstellen, die die Qulität der verschiedenen Methoden abbildet. Parhelia bringt kantenglättungstechnisch soviel wie 8xS. Texturmäßig ist 8xS natürlich im Vorteil, und es werden im Gegensatz zum Parhelia-FAA auch keine Polygon-Schnittkanten "vergessen". Man kann keine generelle Rangfolge erstellen, aber ich versuche mal einige bekannte Modi reineweg nach Qualität zu "sortieren".


2x auf GeForce1/2, Radeon <= 9000, Kyro1/2
2x auf GeForce3/4, Radeon <=9000 in D3D ohne Fog, Radeon 9500/9700 (großer Sprung!)
4x auf GeForce 1-FX, Radeon <= 9000, Kyro1/2, Parhelia (kleiner Schritt)
6x auf Radeon <= 9000
4xS auf GeForce3/4
16x auf Parhelia*
4x auf Voodoo5, 4x auf Radeon8500/9000 in D3D ohne Fog, 4x auf Radeon9500/9700
8xS auf GeForce3/4/FX
6x auf Radeon9500/9700


* 16x FAA ist kantenglättungstechnisch 4x von Voodoo5 knapp überlegen, wurde von mir aber wegen "vergessener" Schnittkanten abgestuft. Man könnte auch diskutieren ob man 16x FAA deshalb unter 4xS stufen sollte. So einfach sind Vergleiche leider nicht.

aths
2002-11-25, 18:30:02
.

:)

Leonidas
2002-11-25, 18:49:09
Originally posted by Desti
hmm...bei dem Morrobigshot bekomm ich oben so nette Fehlermeldungen :)

[i]Warning: Cannot add header information - headers already sent by (output started at /homepages/6/d68770829/htdocs/artikel/2002/11-24_pic4.php:1) in /homepages/6/d68770829/htdocs/admin/shared.php on line 181




Oops, mal schauen.



Update: Minimaler Schreibfehler in der Datei, gefixt.

MadManniMan
2002-11-25, 20:07:26
ahts,

hassu vergeßt inne tabelle folgendes:

2* bei r200+ ohne fog und 2* bei r300 auch mit fog wie gf3+

turboschlumpf
2002-11-25, 21:00:58
trotzdem seit 2 jahren unerreicht das 8x rgssaa der voodoo 5 6000 :D
hat noch niemand versucht das auch in den treibern für ne voodoo 5 5500 zu realisieren??

StefanV
2002-11-25, 21:01:39
Originally posted by zeckensack
Meinst ???

Also was tatsächlich geplant war, aber nicht gefunzt hat, waren die programmierbaren 'intelligenten' Subpixelanordnungen, die man in frühen Reviews der Karte bewundern kann.

1. ja, mein ich...
Hab ich irgendwo mal gelesen, weiß nur nicht mehr wo...

2. das auch...
Allerdings fand ich das FSAA der 30er Treiber besser als das der 60er Serie...

StefanV
2002-11-25, 21:04:10
Originally posted by aths
Ich meine da mal Bilder gesehen zu haben, die ein RG-Muster nachwiesen ließen. Und zwar in D3D, wenn kein Fogging aktiviert ist.

war es auf BNO Net oder Tommti Systems??

StefanV
2002-11-25, 21:05:11
Originally posted by Axel
Ein gut zu lesender Artikel.
Es wäre schön, wenn du vollständigkeitshalber die Qualität des AA einer Parhelia mit einordnen würdest. Das würde das Gesamtbild abrunden.
Diese verschiedenen Modi die jeder Hersteller angibt, sind ja nicht so richtig vergleichbar. Vielleicht kannst du eine Rangliste erstellen, die die Qulität der verschiedenen Methoden abbildet.

Das Problem ist nur jemanden mit einer Parhelia zu finden.

Vor ein paar Wochen hätte ich zur Verfügung gestanden, jetzt nicht mehr, da meine Parhelia nicht mehr so recht funzt.
Muß mal MGA 'anfunken'...

aths
2002-11-25, 21:45:12
Originally posted by Stefan Payne
war es auf BNO Net oder Tommti Systems?? Tommti könnte gut hinhauen. Ich glaube, dass er SeSam und Max Payne-Screenshots hatte, die in D3D zeigten, dass Radeon8500 durchaus RGSS beherrscht.

MadManniMan
2002-11-25, 21:46:03
Originally posted by turboschlumpf
trotzdem seit 2 jahren unerreicht das 8x rgssaa der voodoo 5 6000 :D
hat noch niemand versucht das auch in den treibern für ne voodoo 5 5500 zu realisieren??

1) oh ja das ist es

2) das aa des vsa-100(+1) is ne reine hw-lösung, da is leider nix mit treibern zu machen. ein chip schafft immer 2*

Exxtreme
2002-11-25, 21:49:20
Originally posted by aths
Tommti könnte gut hinhauen. Ich glaube, dass er SeSam und Max Payne-Screenshots hatte, die in D3D zeigten, dass Radeon8500 durchaus RGSS beherrscht.
Thomas von Tommti-Systems war's. Ich habe ihn damals im Forum angeschrieben warum die R200 oft OGSSAA und manchmal RGSSAA nutzt. Er hat es dann anhand von Max Payne rausgefunden, daß es am Fog lag.

i_Land
2002-11-25, 23:29:46
Guter Artikel Aths

3Dc ist echt gut

Unregistered
2002-11-26, 10:01:41
Originally posted by aths
Mit 4x OG MS lassen sich kaum sinnvolle Modi basteln. Da kann 4x MS noch so schnell sein, es sieht kaum besser aus als wenn man 2x MS verwendet. Würde man auf der Basis von 4x OG MS und OG SS einen 6x und einen 8x-Modus basteln, sähen diese erheblich schlechter aus als das was im Moment geboten wird.


Ouch...

Das tut weh. Vor allem deshalb weil die GFfx sowieso schon zu wenig Bandbreite pro Pixel hat ( nur 32bit/Pixel) und wegen des hohen SSAA-Anteils die Kompression nur unzureichend funktionieren wird und damit die nutzbare Bandbreite noch weiter abfällt.

Die GFfx wird bei eingeschaltetem qualitativ hochwertigem AA also ziemlich langsam werden. Einzig 4xMSAA wird wohl schnell sein. Hoffentlich hat das dann wenigstens einen Rotated Grid Sample Pattern. Ist doch so?

aths
2002-11-26, 10:42:30
Originally posted by Unregistered
Einzig 4xMSAA wird wohl schnell sein. Hoffentlich hat das dann wenigstens einen Rotated Grid Sample Pattern. Ist doch so? Würde es ein 4x Rotated Grid Pattern geben, würde man kaum 6xS und 8xS einführen. Und so wie DK von einer Verschnellerung des 4x-Modu schwärmte, wird es wohl keine Verbesserung in der Qualität geben.

Unregistered
2002-11-26, 10:59:06
Doppel-OUCH!

die GFfx ist also für qualitativ hochwertiges (und trotzdem ausreichend schnelles) AA ungeeignet. Eine Schande!

ow
2002-11-26, 11:56:09
Originally posted by Unregistered
Doppel-OUCH!

die GFfx ist also für qualitativ hochwertiges (und trotzdem ausreichend schnelles) AA ungeeignet. Eine Schande!


Koenntest du das bitte mit Benches belegen??

Unregistered
2002-11-26, 12:09:31
reicht Logik?

zeckensack
2002-11-26, 12:10:48
Originally posted by Unregistered
reicht Logik? Nein. Nicht in Geschwindigkeitsfragen :P

nggalai
2002-11-26, 13:12:19
Wie gesichert ist es eigentlich, dass die 8x und 6xS-Modi auf der GFFX gleich "aussehen" werden? Bei der GF4 gibt's "dank" Accuvue (oder wie auch immer geschrieben) ja auch geringe Unterschiede gegenüber der GF3, obwohl die Modi mit denselben Registry-Schlüsseln aktiviert werden.

ta,
-Sascha.rb

Unregistered
2002-11-26, 13:18:51
Originally posted by zeckensack
Nein. Nicht in Geschwindigkeitsfragen :P

Verständlich. Ich versuchs doch ( all the following is strictly IMHO :D ) :

die Brandbreitenkompression funktioniert in etwa so (soweit ich das verstehe) das nur (Sub)Pixel weggelassen/nicht übertragen werden müssen, die genauso "aussehen" wie die Nachbar(sub)pixel.

MSAA + Kompression funktioniert deshalb so gut, weil hier nur die Eckpunkte mehr als eine Farbe/Subpixel haben. Die Subpixel innerhalb eines Polygons haben immer dieselbe Farbe.

Bei SSAA werden alle Subpixel neu gesampled. Dh. jedes Subpixel hat eine eigene Farbe (da sie gleiche Textur verwenden allerdings nur geringe Unterschiede). Deshalb sieht SSAA besser aus als MSAA.


Wenn die GFfx-Karten also nur 2xRGMS + 3-4xSSAA für die hochwertigen AA-Modes verwenden, dann kann die Bandbreitenkompression nur den 2xRGMS-Anteil "bearbeiten" und die SSAA-Anteile bleiben unberührt.

Normalerweise benötigt 4xSSAA eine 4x höhere Bandbreite für Z-Buffer und Framebuffer (die Texturbandbreite lassen wir mal außen vor).

Der 6xS mode benötigt theoretisch eine 6x höhere Bandbreite. der 8x Mode eine 8x höhere Bandbreite. Da nur der 2xRGMS-Anteil komprimiert werden kann, benötigen diese beiden Modes also 3x oder 4x mehr Bandbreite wie ohne AA.

Die GFfx hat 4GPixel Fillrate und 16GB/sec Bandbreite => 32bit / Pixel Fillrate

Die R300 hat 2.6GPixel und 19,8GB/sec => 61bit / Pixel.

Die Ti4600 hat 1.2GPixel und 10.4GB/sec => 69bit / Pixel

Die GFfx ist also von Anfang an Bandbreitenbegrenzt. Die max Füllrate wird sehr wahrscheinlich nie (oder nur mit extremem Multitexturing) erreicht.

OnTop kommt jetzt der exorbitant hohe Bandbreitenbedarf für die qualitativ hochwertigen AA-Modes. Damit sollte die Framerate bei 6xS um min. 50% und bei 8x um min. 66% einbrechen (rein geschätzt, da theoretisch die Frameraten bei 6xS um 66% und bei 8x um 75% einbrechen sollten).

Ein offener Punkt bei dieser Betrachtung ist die Color-Compression der GFfx-Karten; die ja auch ohne AA funktionieren soll und damit auch bei SSAA einiges wieder rausreißen könnte. Ich traue dieser Kompression aber nicht mehr als 15-20% zu und die habe ich bei meiner FPS-Schätzung schon mit abgedeckt.

Wenn also Nvidia nicht ein Wunder vollbracht hat bei der Color-Compression, dann sind die qualitativ hochwertigen AA-Modes IMHO ziemlich langsam ausgefallen.

ow
2002-11-26, 13:29:17
Sehr schoenes Posting.:)

Aber "ziemlich langsam" kann immer noch "ausreichend schnell" (s. dein erstes Posting) sein. Darum geht es mir.
Wenn die Rohleistung des NV30 fuer 300fps reicht, dann darf er imo auch gerne um 60-70% einbrechen.

Also dies hier: "die GFfx ist also für qualitativ hochwertiges (und trotzdem ausreichend schnelles) AA ungeeignet" halte ich immer noch fuer falsch, da unbelegt.

Wenn es die ersten richtigen GFFX Reviews gibt, wissen wir mehr.
Und solange sollten wir uns alle gedulden und auch zurueckhalten mit Aussagen wie "zu langsam, nicht schoen genug, etc...."

zeckensack
2002-11-26, 13:49:49
Genau :)

MadManniMan
2002-11-26, 13:56:07
Originally posted by nggalai
(...)obwohl die Modi mit denselben Registry-Schlüsseln aktiviert werden.


sehr richtig, im moment können wir nur spekulieren, wobei ich aber glaube, daß die änderung einzig die gammakorrektur ist, zumal der sprung von gf3 auf gf4 (samplepattern diagonal verschoben) recht gering ist

Quasar
2002-11-26, 13:59:42
Ein gutes, aber IMO zu theoretisches Posting.
Nicht berücksichtigt (u.a.) wird, dass das Verhältnis von Füllraten und Bandbreitenbedarf bei Supersampling ein anderes ist (Textur-Caching sei dank), sowie die allgemeine Effizienz des Speichersubsystems und dessen Grad der Entkoppelung von den Renderpipes.

Auch der Radeon9700pro würde ich z.B. durchaus zutrauen, exzellente Leistung beim Supersampling zu erbringen.

Ich lasse mich nach wie vor überraschen....

MadManniMan
2002-11-26, 14:08:36
Originally posted by Quasar
Auch der Radeon9700pro würde ich z.B. durchaus zutrauen, exzellente Leistung beim Supersampling zu erbringen.


gabs da nichmal das gerücht von SS aufm r300 :eyes:

Exxtreme
2002-11-26, 14:20:01
ATi will's anscheinend nicht einbauen. Über die Gründe wurde auch schon spekuliert. Sollte ich jemals Zugriff auf das interne Developer-Forum von ATi bekommen, dann werde ich dort nachfragen.
Originally posted by MadManniMan


gabs da nichmal das gerücht von SS aufm r300 :eyes:

Axel
2002-11-26, 18:26:22
Originally posted by aths
Parhelia bringt kantenglättungstechnisch soviel wie 8xS. Texturmäßig ist 8xS natürlich im Vorteil, und es werden im Gegensatz zum Parhelia-FAA auch keine Polygon-Schnittkanten "vergessen". Man kann keine generelle Rangfolge erstellen, aber ich versuche mal einige bekannte Modi reineweg nach Qualität zu "sortieren".


2x auf GeForce1/2, Radeon <= 9000, Kyro1/2
2x auf GeForce3/4, Radeon <=9000 in D3D ohne Fog, Radeon 9500/9700 (großer Sprung!)
4x auf GeForce 1-FX, Radeon <= 9000, Kyro1/2, Parhelia (kleiner Schritt)
6x auf Radeon <= 9000
4xS auf GeForce3/4
16x auf Parhelia*
4x auf Voodoo5, 4x auf Radeon8500/9000 in D3D ohne Fog, 4x auf Radeon9500/9700
8xS auf GeForce3/4/FX
6x auf Radeon9500/9700


* 16x FAA ist kantenglättungstechnisch 4x von Voodoo5 knapp überlegen, wurde von mir aber wegen "vergessener" Schnittkanten abgestuft. Man könnte auch diskutieren ob man 16x FAA deshalb unter 4xS stufen sollte. So einfach sind Vergleiche leider nicht.


Danke ! :)

aths
2002-11-26, 21:52:28
Originally posted by Axel
Danke ! :) Dabei handelt es sich weniger um eine technisch objektiv begründete Tabelle, mehr um meine Meinung zu diesem Thema. (Diese kann ich natürlich auch begründen, aber mit anderen Präferenzen sind andere "Rangfolgen" möglich. Ich habe mich in erster Linie auf Kantenglätte konzentiert.)

aths
2002-11-26, 21:54:59
Originally posted by nggalai
Accuvue (oder wie auch immer geschrieben) ja auch geringe Unterschiede gegenüber der GF3, obwohl die Modi mit denselben Registry-Schlüsseln aktiviert werden.AccuView.

Die geringen Unterschiede sind nach einer Vermutung von ram wohl möglicherweise auch mit GF3 machbar. (rams Vermutungen traue ich eher als Marketinggeblubber großer Firmen.)

aths
2002-11-26, 22:04:46
Zur Nutzbarkeit von 8xS auf GeForceFX. Die Karte ist füllratenmäßig einer Ti 4600 um 233% überlegen. Geht man davon aus, dass diese Füllrate auch voll ankommen sollte, kann man also mit der gut dreifachen Framerate einer Ti 4600 rechnen.

Bandbreitenmäßig überragt sie diese aber um nur gut 50%.

Es kommt also tatsächlich darauf an, was die Color Compression bringt.

Doch selbst wenn die Bandbreite nicht limitiert, so ist 8xS bei UT2003 natürlich nicht zu gebrauchen. Afaik (habe jetzt gerade keine Benches parat) müsste die Radeon9700 Pro bei 4x (gleiche Kantenglättungsqualität) noch absolut spielbare Frameraten bringen.

Quasar
2002-11-26, 22:10:39
Originally posted by aths
Zur Nutzbarkeit von 8xS auf GeForceFX. Die Karte ist füllratenmäßig einer Ti 4600 um 233% überlegen.
233% mehr....


Doch selbst wenn die Bandbreite nicht limitiert, so ist 8xS bei UT2003 natürlich nicht zu gebrauchen. Afaik (habe jetzt gerade keine Benches parat) müsste die Radeon9700 Pro bei 4x (gleiche Kantenglättungsqualität) noch absolut spielbare Frameraten bringen.
Das tut sie. In 1600x1200 wird's allerdings etwas knapp.

Quasar
2002-11-26, 22:12:34
Originally posted by aths
Die geringen Unterschiede sind nach einer Vermutung von ram wohlmöglich auch mit GF3 machbar. (rams Vermutungen traue ich eher als Marketinggeblubber großer Firmen.)
Auch das quasi gespiegelte Subpixelraster bei 2xFSAA?
es heisst "womöglich"...

aths
2002-11-26, 22:19:58
Originally posted by Quasar
233% mehr....Jopp. "um ... überlegen" heißt bei mir "um ... mehr". "Um 100% überlegen" = doppelt so schnell.


Für "normale" Spiele sollte die GF FX genügend Power haben, um 8xS relativ breit einsetzen zu können.

aths
2002-11-26, 22:21:11
Originally posted by Quasar
Auch das quasi gespiegelte Subpixelraster bei 2xFSAA?Gespiegelt? Was, wo?

Quasar
2002-11-26, 22:33:30
Das 2xFSAA-Subpixelraster von GF3 ist "Obenrechts_untenlinks", bei der GF4 ist's "Obenlinks_untenrechts", um's mal in Worten auszudrücken. Oder spielt mir meine Erinnerung einen Streich??

aths
2002-11-26, 22:40:06
Originally posted by Quasar
Das 2xFSAA-Subpixelraster von GF3 ist "Obenrechts_untenlinks", bei der GF4 ist's "Obenlinks_untenrechts", um's mal in Worten auszudrücken. Oder spielt mir meine Erinnerung einen Streich?? Jopp.

Aufklärung sollte der 3DC-FSAA-Artikel bringen. Das gesamte Raster wurde ins Pixel verschoben. Man könnte aber ebensogut sagen, dass nicht das Raster, sondern nur die Textursampleposition verschoben wurde. Letzteres "stimmt" glaube ich auch eher. (Dann wären die Erklärungsbilder im Artikel bei GF4 sogar falsch. Ich habe das Muster aus den White Papers von nV übernommen.)

Quasar
2002-11-26, 23:08:32
Auf was bezieht sich jetzt dein "jopp"? Auf mein Gedächtnis oder das Sample-Muster?

Unregistered
2002-11-27, 09:47:19
Originally posted by aths
Zur Nutzbarkeit von 8xS auf GeForceFX. Die Karte ist füllratenmäßig einer Ti 4600 um 233% überlegen. Geht man davon aus, dass diese Füllrate auch voll ankommen sollte, kann man also mit der gut dreifachen Framerate einer Ti 4600 rechnen.

Bandbreitenmäßig überragt sie diese aber um nur gut 50%.

Es kommt also tatsächlich darauf an, was die Color Compression bringt.

Doch selbst wenn die Bandbreite nicht limitiert, so ist 8xS bei UT2003 natürlich nicht zu gebrauchen. Afaik (habe jetzt gerade keine Benches parat) müsste die Radeon9700 Pro bei 4x (gleiche Kantenglättungsqualität) noch absolut spielbare Frameraten bringen.


So ungefähr hab ich meinen Kommenentar "die GFfx ist also für qualitativ hochwertiges AA ungeeignet" gemeint.

Bandbreite = Füllrate; mehr geht halt nicht.

Die Ti4600 schafft theoretisch 1.2GPixel/sec und schafft im 3DMark2001 so ca. 1050-1100MPixel single-Textured.

Die GFfx hat 16GB/sec Bandbreite; die Ti4600 10.4GB/sec

Die GFfx wird also beim 3DMark2001 ca. 1600 - 1700MPixel/sec schaffen. IMHO wird die Color-Compression nur ca. 25% bringen und damit die Füllrate auf vielleicht 2100MPixel schaufeln (Ich hoffe trotzdem, das es mehr ist).

Bei 6xS bleiben also nur noch 700MPixel (1/3) übrig; bei 8x nur noch 530MPixel (1/4).

Bei 8x AA ist das dann soviel wie eine neue (leicht übertaktete) GF4 MX440-8x ohne AA schafft.

Bei 6xS soviel wie eine GF4 Ti4200 die man auf 175MHz runter getaktet hat.


IMHO ist das sehr wenig für eine highend-3D Karte und damit ist für mich die GFfx (basierend auf den bisherigen Info's) für hochwertiges AA einfach ungeeignet.

zeckensack
2002-11-27, 09:58:43
IMO kann Kompression nur mit benachbarten identischen Samples funktionieren => man wird AA anschalten müssen.

Das würde dann vielleicht tatsächlich zu 2xAA 'for free' führen ?-)

Unregistered
2002-11-27, 10:28:57
Originally posted by zeckensack
IMO kann Kompression nur mit benachbarten identischen Samples funktionieren => man wird AA anschalten müssen.

Das würde dann vielleicht tatsächlich zu 2xAA 'for free' führen ?-)

Yep; deshalb habe ich ja bei 6xS nur mit der 3fachen Füllrate gerechnet und bei 8x nur mit der 4fachen. Ich hoffe aber immer noch etwas das die Color-Compression auch dann hilft, wenn die benachbarten Samples geringfügig unterschiedlich sind und man die Differenz mit (fixen) 8bit oder 16bit abspeichert. Dann würde die Color-Compression sogar mehr als die (von mir geschätzten) 25% bringen. Allerdings hätte Nvidia dann IMHO voll in dieses Horn gestoßen um dem Marketing zu helfen (und ATi zu schaden).

Demirug
2002-11-27, 11:29:32
Was die Kompression bringt wird davon abhängen wie sie ausgelegt ist. IMO hat sich NVIDIA aber nicht mit dem einfachsten Model der Kompression zufrieden gegeben. Aber selbst bei der einfachsten Methode ergibt sich schon eine enorme Einsparung. Benutzen wir mal die immer wieder beliebte DOOM III Engine.

Pro Pixel im Durchschnitt 2 Lichtquellen ergibt auf der FX zwei Passes mit Alphablending. Also:

Einlesen + Schreiben + Einlesen + Schreiben =
0xAA 16 Byte
4xAA 64 Byte

Wenn nun bei 4xAA die Kompresion voll wirkt kommen wir auf 16 Byte. Kann die Kompression nur wirken wenn alle Samples gleich sind ergibt sich das sie bei etwa 20% der Pixel nicht wirken wird (Matrox geht sogar von noch weniger aus). Also 80% 16 Byte und 20% 64 Byte ergibt im Durchschnitt 25,6 Byte was nur noch 40% der ursprüngliche Bandbreite wäre. Und das 1,6 fache der Bandbreite ohne AA.

Rechnen wir jetzt sogar nur mit 10% Kanten Pixel ergeben sich 20,8 Byte (32,5% bzw. 1,3 mal Bandbreite ohne AA).

Unregistered
2002-11-27, 12:36:24
Originally posted by Demirug
Was die Kompression bringt wird davon abhängen wie sie ausgelegt ist. IMO hat sich NVIDIA aber nicht mit dem einfachsten Model der Kompression zufrieden gegeben. Aber selbst bei der einfachsten Methode ergibt sich schon eine enorme Einsparung. Benutzen wir mal die immer wieder beliebte DOOM III Engine.

Pro Pixel im Durchschnitt 2 Lichtquellen ergibt auf der FX zwei Passes mit Alphablending. Also:

Einlesen + Schreiben + Einlesen + Schreiben =
0xAA 16 Byte
4xAA 64 Byte

Wenn nun bei 4xAA die Kompresion voll wirkt kommen wir auf 16 Byte. Kann die Kompression nur wirken wenn alle Samples gleich sind ergibt sich das sie bei etwa 20% der Pixel nicht wirken wird (Matrox geht sogar von noch weniger aus). Also 80% 16 Byte und 20% 64 Byte ergibt im Durchschnitt 25,6 Byte was nur noch 40% der ursprüngliche Bandbreite wäre. Und das 1,6 fache der Bandbreite ohne AA.

Rechnen wir jetzt sogar nur mit 10% Kanten Pixel ergeben sich 20,8 Byte (32,5% bzw. 1,3 mal Bandbreite ohne AA).

Wie schon gesagt, die (einfache) Kompression funktioniert bei MSAA sehr gut, wie ja auch der R300 eindrucksvoll zeigt.

Bei SSAA haben aber die Subpixel immer eine unterschiedliche Farbe, da ja jedes Subpixel extra gerendert wird, und die 4,8 oder 16 Texel immer unterschiedlich zusammengerechnet werden (je nach Position des Subpixels im Pixel). Die Einfache Kompression funktioniert hier also nicht.

Deshalb stört mich ja der hohe Anteil an SSAA bei den 6xS und 8x - Modes so sehr, da dann die einfache Art der Kompression nur bei dem vergleichsweise "billigem" (in Bezug auf Bandbreite) 2xRGMS-Anteil funktioniert.
Wenn sich Nvidia nicht was schlaues einfallen hat lassen, dann stehen die bei den AA-Benchmarks ziemlich nass im Regen. :(

Demirug
2002-11-27, 12:39:31
Wie gesagt ich ja auch davon aus das da mehr als nur eine einfache Kompression eingebaut wurde.

MadManniMan
2002-11-27, 17:03:38
wie sieht das jetzt eigentlich mit den kompressions-modi bei nv30 und r300 aus? letzterer benützt framebufferkompression, ersterer 'color'kompression - ist das etwas dasselbe oder wie oder was oder wo

Demirug
2002-11-27, 17:31:06
@MadManniMan:

Ist im Prinzip beides das gleiche. Nur werden wohl NVIDIA und ATI unterschiedliche Verfahren benutzten.

aths
2002-11-27, 17:58:15
Originally posted by Quasar
Auf was bezieht sich jetzt dein "jopp"? Auf mein Gedächtnis oder das Sample-Muster? Gnarf. Deine Erinnerung spielt dir einen Streich, wie der erwähnte (http://www.3dcenter.org/artikel/anti-aliasing/index16.php) AA-Artikel zeigt.

Krischi
2002-12-03, 14:49:22
Habs mal getestet auf meinem System,
im 3DMark99 MAX, ich erreiche mit der Geforce 3Ti200(mit 128MB Speicher) auf 210MHz Core und 490MHz Speicher unter 800x600 in 16Bit (Double Buffer, 24Bit Z-Buffer) mit 8xS und 2xAF im ersten Game ca. 36fps...
Dabei ist die Qualität einfach prächtig, das sieht so geil aus, ich würde alles nur noch in 800x600 und 8xS AA spielen, wenns möglich wäre...

Nur mal so als "Erfahrungsbericht..."

;)