Eingesparte ROPs [Archiv] - 3DCenter Forum

Archiv verlassen und diese Seite im Standarddesign anzeigen : Eingesparte ROPs

PhoenixFG

2004-09-17, 07:03:00

Wie mal lesen kann, hat ja der NV43 angeblich nur 4 ROPs für 8 Pipelines. Sind durch diese Sparmaßnahme noch weitere Nachteile zu erwarten, abgesehen von einer beschnittenen Leistung unter bilinearem Singletexturing? Und wenn ja, warum?

MfG

aths

2004-09-17, 08:49:49

PhoenixFG

2004-09-18, 20:01:38

Sorry, genau den hatte ich noch nicht durchforstet. THX.

Coda

2004-09-18, 20:06:41

In allen zukünftigen Spielen: Nein.

Ailuros

2004-09-18, 20:13:21

In allen zukünftigen Spielen: Nein.

Man erwartet von einer mainstream Karte und dem Preis auch keine besondere AA Leistung und daher stimmt auch die Aussage IMHO.

robbitop

2004-09-20, 17:07:02

pah, wer nutzt schon AA ohne AF?
Nur wenn man reines AA nutzt macht sich das bemerkbar. Bei AF loopen die Pipes eh. Bei langen Shadern ebenfalls.
IMO kaum/kein Nachteil.

Coda

2004-09-20, 17:27:38

Mal bissel OT:
Aber warum kommt die 6600 eigentlich auf über 150 Mio. Transistoren?
Eigentlich is sie ja weniger als ein halber NV40, also müsste sie doch eher 100 Mio. haben :confused:

aths

2004-09-20, 17:46:39

Mal bissel OT:
Aber warum kommt die 6600 eigentlich auf über 150 Mio. Transistoren?
Eigentlich is sie ja weniger als ein halber NV40, also müsste sie doch eher 100 Mio. haben :confused:Der 2D-Teil (und der Video-Prozessor), die ganze Komprimierungslogik etc. fallen in jedem Fall an.

Coda

2004-09-20, 18:22:07

Ja schon, aber das is trotzdem extrem viel find ich.
Dann wären 24 Pipelines ja bei nem Die Shrink ohne weiteres möglich.

Quasar

2004-09-20, 18:35:02

Ja. :)

aths

2004-09-21, 00:07:59

Ja schon, aber das is trotzdem extrem viel find ich.Finde ich nicht :)

Ailuros

2004-09-21, 04:03:19

pah, wer nutzt schon AA ohne AF?
Nur wenn man reines AA nutzt macht sich das bemerkbar. Bei AF loopen die Pipes eh. Bei langen Shadern ebenfalls.
IMO kaum/kein Nachteil.

Was soll das jetzt schon wieder heissen? NV43 ist in keinem Fall schneller als eine einfache 6800 und ja da spielen die ROPs auch eine wichtige Rolle unter anderem.

Loops? Wie genau wird 4xRGMS auf NV4x erreicht und mit wieviel weniger Leistung?

AF mit oder ohne Optimierungen? Die AA-Fuellrate ist nur um etwa 10% hoeher als die trilineare Fuellrate auf der 6800. Wie sieht es genau beim NV43 aus?

Als mainstream Karte zeigt sich der NV43 als ausgezeichnete Loesung, aber so viel was Antialiasing betrifft erwarte ich von dem Ding nun unbedingt auch nicht. UT2k4 ist in 1280*960*32 mit 2xAA/4xAF gerade noch spielbar auf der 6800 hier und da ruckelt es wie verrueckt an manchen Stellen in ONS oder Assault maps. Es aendert sich auch nicht viel in D3 oder FC.

Ich denke ich rede gerade von einer high end Karte oder? :|

robbitop

2004-09-21, 10:23:20

nicht optimiertes AF. Bei optimiertem AF wird es etwas schlimmer ja.

NV43 muss ab 2xAA einmal loopen. Das wäre bitter, wenn der endgültige Farbwert inkl Beleuchtung für die jeweiligen Pixel vorher schon feststehen würde.
Heutzutage haben wir trilineares Multitexturing. Pro Farbwert schafft NV43 1 trilinearen Pixel oder einen 2xAF gefilteten bilinearen Pixel.
Hast du 2 Texturschichten, brauchst du eh einen neuen Durchgang.

Pro Texturschicht:
Kommt bei Tri Filterung 2xAF hinzu 1x loopen (also 2 Durchgänge)-> 2xAA ist kaschiert.
4xAF (4 Durchgänge) -> kaschiert 4xAA.
Da der NV40 eine winkelabhängige Filterung besitzt ist diese Theorie schonmal etwas fern ab der Praxis. Aber wenn man 4-8x trilineares AF hat und Multitexturing (was sowieso fast immer im Einsatz ist), machen die weniger Loops kaum etwas aus.

Wobei die Z-Test Leistung und die Blendingleistung etwas darunter leiden. Aber AA Füllrate spielt nur eine untergeordnete Priorität, wenn die Pipeline mehrere Durchgänge braucht um den entgültigen Farbwert + Beleuchtung zu bestimmen.
Und die immer komplexer und länger werdenden Shader tun dazu noch einiges hinzu.
Eben auch eine Karte für die Zukunft.

Also das von dir angesprochene Problem ist schon da, das will ich eigentlich nicht leugnen, aber nicht so stark, wie man es aus deinen Formulierungen entnehmen könnte. Andererseits spart man wertvolle Transistoren und etwas Bandbreite. Das ist eine Midrangekarte, das sollte man nicht vergessen. Aber eben auch für die Zukunft gerüstet (auch wegen Z-First pass Engines)

In der Praxis sollte der Verschnitt nicht allzuhoch sein (Fogging mal ausgenommen).
Ausserdem sind 4 (trilinear gefilterte) Farbwerte etwas günstiger als 8 (bilinear gefilterte) für die externe Bandbreite. Bei einem 128bit DDR Interface genau das Richtige.

Ailuros

2004-09-22, 01:45:59

nicht optimiertes AF. Bei optimiertem AF wird es etwas schlimmer ja.

Muss ich Dir erlaeutern wie NVIDIA selber vorschlaegt dass man ihre Karten testen soll, wieso Treiber default auf "quality" gesetzt ist und wieso die Mehrzahl der Reviews meistens NUR quality benutzen?

Noch besser: welche settings benutzt Deiner Meinung nach die Mehrzahl der Benutzer?

NV43 muss ab 2xAA einmal loopen.

Ist genauso bei allen NV2x/3x/4x.

Heutzutage haben wir trilineares Multitexturing. Pro Farbwert schafft NV43 1 trilinearen Pixel oder einen 2xAF gefilteten bilinearen Pixel.
Hast du 2 Texturschichten, brauchst du eh einen neuen Durchgang.

Pro Texturschicht:
Kommt bei Tri Filterung 2xAF hinzu 1x loopen (also 2 Durchgänge)-> 2xAA ist kaschiert.
4xAF (4 Durchgänge) -> kaschiert 4xAA.
Da der NV40 eine winkelabhängige Filterung besitzt ist diese Theorie schonmal etwas fern ab der Praxis. Aber wenn man 4-8x trilineares AF hat und Multitexturing (was sowieso fast immer im Einsatz ist), machen die weniger Loops kaum etwas aus.

Noe nur 2x mal die AA/AF Leistung in hohen Aufloesungen; weniger ist aeusserst ueber-optimistisch formuliert.

Uebrigens ganz so nebenbei, bei NV40 ohne Optimierungen bricht die trilineare Fuellrate mit quad-texturing und =/>2xAF um 50% ein.

Mit Optimierungen eingeschaltet, ist die brilineare Fuellrate ohne AF um etwa 25% hoeher als tri/noAF, und AF kommt in dem Fall "for free".

Wobei die Z-Test Leistung und die Blendingleistung etwas darunter leiden. Aber AA Füllrate spielt nur eine untergeordnete Priorität, wenn die Pipeline mehrere Durchgänge braucht um den entgültigen Farbwert + Beleuchtung zu bestimmen.
Und die immer komplexer und länger werdenden Shader tun dazu noch einiges hinzu.
Eben auch eine Karte für die Zukunft.

Ich weiss genau wo der theoretische Quark herkommt, nur sprechen eben die realtime Resultate absolut gegen das Marketing-Gefusel eines spezifischen IHVs.

Du kannst am Ende des Tages nicht mehr als 2xAA/optimiertes AF in 1024*768*32 in heutigen anspruchsvollen Spielen von einer NV43 oder R410 erwarten und es wird NICHT besser werden in zukuenftigen Spielen. Dem theoretischen Wirrwarr entgegensetzt beweise mir lieber erstmal das Gegenteil in diesem selben Paragraphen und dann koennen wir weiterreden.

Ohne AA/AF kommt in der Mehrzahl der Faelle eine 6600GT verdammt nahe ran, an eine 6800. Sobald AA/AF eingestellt wird, werden die Unterschiede mehr als nur bemerkbar. Dies aendert sich aber auch nicht im Vergleich zwischen einer 6800nonU und einer 6800GT/Ultra.

Also das von dir angesprochene Problem ist schon da, das will ich eigentlich nicht leugnen, aber nicht so stark, wie man es aus deinen Formulierungen entnehmen könnte. Andererseits spart man wertvolle Transistoren und etwas Bandbreite. Das ist eine Midrangekarte, das sollte man nicht vergessen. Aber eben auch für die Zukunft gerüstet (auch wegen Z-First pass Engines)

Welche Transistoren werden gespart? ~160M vs. 222M und mir ist bewusst dass hier eine grosse Mehrzahl auf den video Prozessor ging, ich hab nur noch nicht kapiert wieso man das Ding auf einer mainstream Karte braucht und um jetzt mal ganz streng zu sein, ich habe bis jetzt von dem Ding keinen einzigen nennenswerten Vorteil auf der 6800 zu sehen bekommen im Vergleich zu vorigen Loesungen. Ich bin bereit zu warten bis vielleicht hier mit zukuenftigen Treibern nachgeschoben wird, aber momentan wenn es um DVD-playback als Beispiel geht vermisse ich eher die Qualitaet und Leistung voriger Loesungen,

Natuerlich ist es eine Mid-range Karte und daher sollte man auch nichts besonderes in der AA-Abteilung erwarten und daher waeren auch sagen wir mal 8 ROPs ueberfluessig gewesen. Aendert aber nichts an den Tatsachen im obrigen Paragraph. Ich bin mir nicht so sicher dass man hier an der richtigen Stelle gespart hat.

NVIDIA wird wohl keinen besonderen Grund gehabt haben, dass alle 16 ROPs immer noch auf der einfachen 6800 operativ blieben, obwohl ein quad und VS deaktiviert wurde.

Die ersten R410 vs NV43 sind schon veroeffentlicht; wieviel haette mehr AA Leistung NV wirklich geschadet am Ende des Tages hm?

In der Praxis sollte der Verschnitt nicht allzuhoch sein (Fogging mal ausgenommen).
Ausserdem sind 4 (trilinear gefilterte) Farbwerte etwas günstiger als 8 (bilinear gefilterte) für die externe Bandbreite. Bei einem 128bit DDR Interface genau das Richtige.

Die Theorie der idealen Loesung zerbricht aber unheimlich schnell eine DeltaChrome. Zu starke Generalisierungen sind schlecht fuer solches Zeug.

aths

2004-09-22, 01:53:35

Ist genauso bei allen NV2x/3x/4x.Das wäre mir neu.

Ailuros

2004-09-22, 02:48:02

Es kann sein dass ich total falsch damit liege, aber ich habe den Eindruck schon seit einiger Zeit. Was genau spricht dagegen?

Coda

2004-09-22, 12:49:59

Gut aths, du könntest recht haben
RV300 hatte glaube ich 75 Mio. Transistoren und R300 110 Mio. Das ist auch ungefähr das selbe Verhälltnis.
Aber ich hab eher damit gerechnet dass der 2D Teil immer eine kleinere Rolle spielt und deshalb die Pipelines ausschlaggebend sind beim Transistor-Count.

Robbitop@FH

2004-09-22, 13:19:58

Es sind 143Mio Transistoren und nicht 160Mio.
Der Videoprozessor ist ein Feature, welches diese VPU exzellent zu verkaufen macht.

Am "Ende des Tages" zählt eher die aritmetische Leistung, AA ist dann nämlich nicht mehr drin.
Deine Anforderungen an den NV43 sind IMO *ärrr* etwas vermessen.

BTW: NV3x/NV40 muss bei 2xAA nicht loopen.

Ailuros

2004-09-22, 19:15:26

Es sind 143Mio Transistoren und nicht 160Mio.
Der Videoprozessor ist ein Feature, welches diese VPU exzellent zu verkaufen macht.

Ein bisschen genauer vielleicht? Wie gesagt vielleicht kannst Du mir zeigen was momentan so besonders dran sein soll, das ich offensichtlich verpasst habe. Ueberhaupt schon ohne eine NV4x in der Hand.

Entschuldige aber 143M sind noch Grund mehr, dass 8 ROPs nicht unbedingt den Transistor-budget des chips zerbrochen haetten. Wenn Du es zu schwer hast mir zu folgen dass es doch eine bessere Idee gewesen waere, die Konkurrenz zu ueberholen, dann hat die Debatte natuerlich keinen Sinn.

Am "Ende des Tages" zählt eher die aritmetische Leistung, AA ist dann nämlich nicht mehr drin.

Arithmetische Leistung wird dem Ding frueher ausgehen als Du Dir vorstellen kannst. Sobald arithmetische Leistung einen gigantischen Unterschied mit SM3.0 machen wird, wird eine NV40 dann eher low-end equivalentes Material sein. Ein aeusserst bloedes Argument, auf dem praktisch jeder NV-fan in der letzten Zeit trommelt und nein Du solltest es nicht persoenlich nehmen, aber ich stosse staendig auf die gleiche Kommentare in Foren und habe leider Zugang zu genug Dokumenten um genau zu wissen woher es her kommt.

Egal was, wo und wie, fuer mich ist nie etwas gegeben und ich schlucke nie alles egal woher es kommt (deshalb auch die Unterschrift unten).

Deine Anforderungen an den NV43 sind IMO *ärrr* etwas vermessen.

Dann lese aber gefaelligst nochmal meinen originalen Post in diesem Thread durch und die originale Frage des Threads.

BTW: NV3x/NV40 muss bei 2xAA nicht loopen.

Um genau zu sein ueberhaupt keiner muss mit 2xAA loopen, dann eher mit 4xAA :P

Spass beiseite:

This also signifies that NV4x is only capable of 2 FSAA Multi-Sample samples per clock cycle, and indeed David Kirk confirmed this to be the case - as it has, in fact, been since NV20. To achieve 4X Multi-Sampling FSAA a second loop must be completed through the ROP over two cycles – memory bandwidth makes it prohibitive to output more samples in a cycle anyway. Unlike ATI, only one loop is therefore allowed through the ROP which continues to restrict NV4x to a native Multi-Sample AA of 4X – modes greater than 4X still require combined Super-Sampling and Multi-Sampling.

http://www.beyond3d.com/previews/nvidia/nv40/index.php?p=11

Und weisst Du was? Es macht auch perfekten Sinn IMO; weil eben die einzige wichtigere Aenderung die beim AA-Algorithmus seit NV20 eingetroffen ist, eigentlich 4xRGMS ist. Dass seit NV25 filter@scanout fuer 2xAA und spaeter bei NV3x noch auch fuer 4xAA implementiert wurde, muss ich wohl noch notieren; sehr wichtig ist diese Kleinigkeit eigentlich nicht.

Wenn B3D offiziell David Kirk zitiert, dann heisst es dass mein Hirn doch nicht vorzeitig verkalkt ist.

Quasar

2004-09-22, 19:39:24

Ailuros,

"NV43 muss ab 2xAA einmal loopen.
"Ist genauso bei allen NV2x/3x/4x.""

Ist etwas uneindeutig. "ab" kann inklusive oder exklusive gemeint sein - daher wohl die Verwirrung hier. ;)

robbitop

2004-09-22, 19:48:52

Ein bisschen genauer vielleicht? Wie gesagt vielleicht kannst Du mir zeigen was momentan so besonders dran sein soll, das ich offensichtlich verpasst habe. Ueberhaupt schon ohne eine NV4x in der Hand.

Eigentlich ist er nichts Besonderes, angeblich auf jeder besseren Videoschnittkarte enthalten. Aber Features bringen eben Kunden. Was meinst du warum die 5200 die erfolgreichste DX9 Karte war. Wegen der Performance?

Entschuldige aber 143M sind noch Grund mehr, dass 8 ROPs nicht unbedingt den Transistor-budget des chips zerbrochen haetten. Wenn Du es zu schwer hast mir zu folgen dass es doch eine bessere Idee gewesen waere, die Konkurrenz zu ueberholen, dann hat die Debatte natuerlich keinen Sinn.

Was hast du denn? NV43 ist doch ziemlich schnell. NV hat ggü ATi einen relativ großen Core. Somit ist die Marge geringer. Das muss man ja nicht unbedingt noch weiter steigern. Somit sparte man lieber, wo man konnte.
Ein paar mehr VS Units wären auch nicht schlecht gewesen neben den 8 ROPs. Gerade für NV43GL und für "the end of the day".

Und immer 4xAA..NV43/RV410 ..das ist Mainstream. Damit wird man nicht lange 4xAA spielen können. 4xAA kostet den NV43 wie du schon sagst viel seiner Leistung (zu viel), RV410 aber auch. Die Anforderung hier sollte eher 2xAA 1024 bis 1280 und dann noch max machbares (solang möglich) AF sein.
Und keiner der hochgelobten Redakteure bencht diese Settings.
1600x1200 4xMS und 16xAF - Ahoi!!! (128MB RAM und 128bit DDR werden sich freuen)

Arithmetische Leistung wird dem Ding frueher ausgehen als Du Dir vorstellen kannst. Sobald arithmetische Leistung einen gigantischen Unterschied mit SM3.0 machen wird, wird eine NV40 dann eher low-end equivalentes Material sein. Ein aeusserst bloedes Argument, auf dem praktisch jeder NV-fan in der letzten Zeit trommelt und nein Du solltest es nicht persoenlich nehmen, aber ich stosse staendig auf die gleiche Kommentare in Foren und habe leider Zugang zu genug Dokumenten um genau zu wissen woher es her kommt.

Die aritmetische Leistung ist größer als die des RV410. HDR, längere Shader, statisches Branching katalysieren das sogar noch. Die aritmetische Leistung sollte also noch ein Weilchen reichen. Zumindist in diesem Belang etwas länger als die des RV410.
Ansonsten hast du Recht, das ganze wird aufgeblasen und übertrieben. Klar will ich nicht übertreiben. Er ist nun auch wieder nicht soo viel aritmetisch stärker als der RV410 dass er in 2 Jahren noch alles brauchbar mit allen Details darstellen könnte. Aber es kann Situationen geben, wo schnelles HDR und schnellere lange Shader den Unterschied machen können.

Ich bin eigentlich nur Fan des FC Hansa Rostock ;) *duck*

Egal was, wo und wie, fuer mich ist nie etwas gegeben und ich schlucke nie alles egal woher es kommt (deshalb auch die Unterschrift unten).

Sehr gute Einstellung :up:

Dann lese aber gefaelligst nochmal meinen originalen Post in diesem Thread durch und die originale Frage des Threads.

Schuldig im Sinne der Anklage :-(

Um genau zu sein ueberhaupt keiner muss mit 2xAA loopen, dann eher mit 4xAA :P

korrekt. NV43 muss allerdings hier schon einmal loopen, oder sehe ich das falsch?

Ailuros

2004-09-22, 20:32:12

Eigentlich ist er nichts Besonderes, angeblich auf jeder besseren Videoschnittkarte enthalten. Aber Features bringen eben Kunden. Was meinst du warum die 5200 die erfolgreichste DX9 Karte war. Wegen der Performance?

Selbst wenn man den Videoprozessor ignoriert, koennte man theoretisch so manchen Schnickschnack durch PS3.0 schleussen. Nicht direkt relevant, aber mal durchlesen und ausprobieren:

http://boards.slackercentral.com/showthread.php?t=61668

DVD/video playback ist immer noch nicht besser als bei der Konkurrenz, zumindest nicht in meinen Augen.

Was hast du denn? NV43 ist doch ziemlich schnell. NV hat ggü ATi einen relativ großen Core. Somit ist die Marge geringer. Das muss man ja nicht unbedingt noch weiter steigern. Somit sparte man lieber, wo man konnte.
Ein paar mehr VS Units wären auch nicht schlecht gewesen neben den 8 ROPs. Gerade für NV43GL und für "the end of the day".

Nein fuer MIMDs. Sie sind zu teuer was den Hardware-budget betrifft. ATI hat nur die ganzen 6 VS im R410 gelassen um im mainstream profi Markt besser konkurrieren zu koennen.

Und immer 4xAA..NV43/RV410 ..das ist Mainstream. Damit wird man nicht lange 4xAA spielen können. 4xAA kostet den NV43 wie du schon sagst viel seiner Leistung (zu viel), RV410 aber auch. Die Anforderung hier sollte eher 2xAA 1024 bis 1280 und dann noch max machbares (solang möglich) AF sein.
Und keiner der hochgelobten Redakteure bencht diese Settings.
1600x1200 4xMS und 16xAF - Ahoi!!! (128MB RAM und 128bit DDR werden sich freuen)

Es wird aus einem sehr speziellen Grund in 1600 gebencht: keine CPU-Limitierungen mehr.

Ja wieso nicht 4xAA bis zu 1024? Kaeme hier der NV43 mit hoeherer 4xAA/AF Geschwindigkeit an als der R410, dann haette NV einen um weites wichtigeren Verkaufspunkt als den VP. Zahlen und Benchmarks verkaufen besser.

Die aritmetische Leistung ist größer als die des RV410. HDR, längere Shader, statisches Branching katalysieren das sogar noch. Die aritmetische Leistung sollte also noch ein Weilchen reichen. Zumindist in diesem Belang etwas länger als die des RV410.

HDR ist schon mit PS2.0 moeglich, darueber moechte ich nichts hoeren. Was Entwickler am Ende machen werden ist eine andere Geschichte. Ja die PS Leistung ist tatsaechlich hoeher auf NV43, aber die R410 stellt die Balance woanders wieder her. Schon den Mother Nature score bemerkt?

Ansonsten hast du Recht, das ganze wird aufgeblasen und übertrieben. Klar will ich nicht übertreiben. Er ist nun auch wieder nicht soo viel aritmetisch stärker als der RV410 dass er in 2 Jahren noch alles brauchbar mit allen Details darstellen könnte. Aber es kann Situationen geben, wo schnelles HDR und schnellere lange Shader den Unterschied machen können.

Es ist nicht meine Schuld wenn so manche Entwickler den Eindruck haben, dass HDR unbedingt mit float blending verbunden sein muss. Schnelleres HDR ist relativ, schau Dir mal die Leistungsunterschiede in dem HDR lighting demo genauer an. Kommt stets auf die Perspektive an. Dieses HDR hin und her ist sowieso Quark; einen grossen Unterschied werden wohl eher zukuenftige Architekturen mit 64bpp HDR (non DAC-able formats) machen (nein ich meine nicht interne Praezision).

korrekt. NV43 muss allerdings hier schon einmal loopen, oder sehe ich das falsch?

Entweder man hat kein AA oder 2xAA (und das wohl auf allen NV2x bis NV4x Karten). Um 4xAA zu erreichen muessen alle noch einen loop mit nochmal 2x samples vornehmen. Der loop wird nur fuer 4xAA vorgenommen.

Kein loop: 2xAA

***edit: um Missverstaendnissen zu entgehen mehr ROPs muessten theoretisch nicht nur bei AA-loops helfen, sondern generell AA Leistung:

noAA:

Display mode: 1600x1200 A8R8G8B8 85Hz
Z-Buffer format: D24S8
--------------------------

FFP - Pure fillrate - 3771.904785M pixels/sec
FFP - Z pixel rate - 7314.768066M pixels/sec
FFP - Single texture - 3482.821289M pixels/sec
FFP - Dual texture - 1859.356934M pixels/sec
FFP - Triple texture - 1253.262573M pixels/sec
FFP - Quad texture - 946.100098M pixels/sec
PS 1.1 - Simple - 1909.124878M pixels/sec
PS 1.4 - Simple - 1909.133789M pixels/sec
PS 2.0 - Simple - 1908.689453M pixels/sec
PS 2.0 PP - Simple - 1909.113281M pixels/sec
PS 2.0 - Longer - 958.690613M pixels/sec
PS 2.0 PP - Longer - 958.392151M pixels/sec
PS 2.0 - Longer 4 Registers - 961.661743M pixels/sec
PS 2.0 PP - Longer 4 Registers - 961.659424M pixels/sec
PS 2.0 - Per Pixel Lighting - 245.008682M pixels/sec
PS 2.0 PP - Per Pixel Lighting - 414.503540M pixels/sec

2xAA:

Fillrate Tester
--------------------------
Display adapter: NVIDIA GeForce 6800
Driver version: 6.14.10.6573
Display mode: 1600x1200 A8R8G8B8 85Hz
Z-Buffer format: D24S8
--------------------------

FFP - Pure fillrate - 3760.739990M pixels/sec
FFP - Z pixel rate - 3760.695313M pixels/sec
FFP - Single texture - 3717.833496M pixels/sec
FFP - Dual texture - 1896.359619M pixels/sec
FFP - Triple texture - 1265.223389M pixels/sec
FFP - Quad texture - 955.401794M pixels/sec
PS 1.1 - Simple - 1906.563721M pixels/sec
PS 1.4 - Simple - 1906.040771M pixels/sec
PS 2.0 - Simple - 1906.034058M pixels/sec
PS 2.0 PP - Simple - 1906.141602M pixels/sec
PS 2.0 - Longer - 958.388367M pixels/sec
PS 2.0 PP - Longer - 958.388672M pixels/sec
PS 2.0 - Longer 4 Registers - 961.658813M pixels/sec
PS 2.0 PP - Longer 4 Registers - 958.388306M pixels/sec
PS 2.0 - Per Pixel Lighting - 244.283722M pixels/sec
PS 2.0 PP - Per Pixel Lighting - 411.617615M pixels/sec

4xAA:

Fillrate Tester
--------------------------
Display adapter: NVIDIA GeForce 6800
Driver version: 6.14.10.6573
Display mode: 1600x1200 A8R8G8B8 85Hz
Z-Buffer format: D24S8
--------------------------

FFP - Pure fillrate - 2283.411133M pixels/sec
FFP - Z pixel rate - 2282.136230M pixels/sec
FFP - Single texture - 2281.008545M pixels/sec
FFP - Dual texture - 1741.836548M pixels/sec
FFP - Triple texture - 1196.664185M pixels/sec
FFP - Quad texture - 912.966064M pixels/sec
PS 1.1 - Simple - 1742.044922M pixels/sec
PS 1.4 - Simple - 1740.684814M pixels/sec
PS 2.0 - Simple - 1740.679565M pixels/sec
PS 2.0 PP - Simple - 1740.678955M pixels/sec
PS 2.0 - Longer - 921.525208M pixels/sec
PS 2.0 PP - Longer - 918.655273M pixels/sec
PS 2.0 - Longer 4 Registers - 921.525574M pixels/sec
PS 2.0 PP - Longer 4 Registers - 921.525269M pixels/sec
PS 2.0 - Per Pixel Lighting - 244.989716M pixels/sec
PS 2.0 PP - Per Pixel Lighting - 411.612579M pixels/sec

Quasar

2004-09-22, 20:55:26

Anstelle der ewigen Looperei: Wie wär's mit AA-Samples pro Takt? ;)

Ailuros

2004-09-22, 21:02:25

Anstelle der ewigen Looperei: Wie wär's mit AA-Samples pro Takt? ;)

Braucht theoretisch AFAIK noch mehr ROPs.

***edit: mal angenommen Radeons wuerden nicht zweimal loopen um 6xAA zu erreichen. Pro SIMD Kanal haben diese einen ROP; ohne loops kann ich mir nur vorstellen dass man 3 brauchen wuerde, was aber fuer eine R420 gleich 48 ROPs bedeuten wuerde.

Man hat mir mal hier privat eine Idee ueber eine dynamische Konfiguration der ROPs zugeschossen fuer die loops; wenn es moeglich waere dann koennte man theoretisch die loops ohne besondere Leistungsbusse bekommen. Keine Ahnung ob so was moeglich ist natuerlich. Klingt aber als Logik vielversprechend.

Quasar

2004-09-22, 21:12:24

Die ROPs des nV40 sind über eine Crossbar angebunden - so sollte ein gute Auslastung möglich sein (auch "billiges" loopen - je nach Konfiguration).

robbitop

2004-09-22, 21:17:12

@AiL

NV4x hat dedizierte HDR HW und beherrscht das einfach schneller.

Naturetest. Ja da wird alles über den VS (sincos fkt) realisiert.
In der Praxis kenne ich kein Spiel wo 3x MIMD VS annähernd limitieren könnten.
Kommt vieleicht aber noch..

LovesuckZ

2004-09-22, 21:20:22

Ja die PS Leistung ist tatsaechlich hoeher auf NV43, aber die R410 stellt die Balance woanders wieder her. Schon den Mother Nature score bemerkt?

Mist der Naturetest die Pixelshaderleistung? ;)

Quasar

2004-09-22, 21:31:55

Robbitop:
"Mother Nature", nicht "Nature" - obwohl auch in ersterem recht viel Vertexleistung verbraten werden sollte.

Quasar

2004-09-22, 21:33:33

Braucht theoretisch AFAIK noch mehr ROPs.

BTW, damit meinte ich, man käme um die Looperei-Fomulierungen herum. Du hast oben schon wieder "zweimal loopen" geschrieben - obwohl es drei vollständige Durchläufe durch die ROPs sind - also drei "Schleifen", wobei die erste oft nicht als Schleife gezählt wird.

robbitop

2004-09-22, 21:42:08

Robbitop:
"Mother Nature", nicht "Nature" - obwohl auch in ersterem recht viel Vertexleistung verbraten werden sollte.

Ja ich meine beide Nature tests.

@LS
VS und PS spielen beide eine starke Rolle.
Merk ich bei meinem Deltachrome. Der Pixelshader ist stärker als der einer 5700 (Shadermark2) und dennoch gewinnt sie in keinem naturetest gegen sie.

LovesuckZ

2004-09-22, 21:49:56

@LS
VS und PS spielen beide eine starke Rolle.
Merk ich bei meinem Deltachrome. Der Pixelshader ist stärker als der einer 5700 (Shadermark2) und dennoch gewinnt sie in keinem naturetest gegen sie.

In einem Test, wo die Vertexshader limitieren, sollte es so sein. Und dies geschieht im Mothernature Test.
Aber dann koennten wir auch argumentieren, dass ATi die zusaetzlichen 8 Rops und 3 Vertexshader nichts bringen, wenn ein Spiel stark auf Multitexturing setzt, da dieses Problem imemr noch bestuende (laut xbitlabs).

aths

2004-09-22, 22:25:03

Es kann sein dass ich total falsch damit liege, aber ich habe den Eindruck schon seit einiger Zeit. Was genau spricht dagegen?Nach meinen Infos hat jede NV2x/NV3x-Pipe zwei ROPs.

Ich bin mir nicht so sicher dass man hier an der richtigen Stelle gespart hat.

NVIDIA wird wohl keinen besonderen Grund gehabt haben, dass alle 16 ROPs immer noch auf der einfachen 6800 operativ blieben, obwohl ein quad und VS deaktiviert wurde.

Die ersten R410 vs NV43 sind schon veroeffentlicht; wieviel haette mehr AA Leistung NV wirklich geschadet am Ende des Tages hm?Am NV43 wurde wohl bewusst einiges gespart, auch um den Abstand zur 6800 zu haltne.

reunion

2004-09-22, 23:21:11

Am NV43 wurde wohl bewusst einiges gespart, auch um den Abstand zur 6800 zu haltne.

Ich bin gespannt wie der NV44 aussehen wird, hoffentlich wird das nicht wieder so eine Krücke wie der NV31. SM3.0 unterstützung deutlich unter 100mio Transistoren ahoi :uhippie:

Ailuros

2004-09-23, 03:13:18

BTW, damit meinte ich, man käme um die Looperei-Fomulierungen herum. Du hast oben schon wieder "zweimal loopen" geschrieben - obwohl es drei vollständige Durchläufe durch die ROPs sind - also drei "Schleifen", wobei die erste oft nicht als Schleife gezählt wird.

Ich zaehle den ersten Durchgang tatsaechlich nicht mit; in dem Sinn sehe ich nichts falsches bezueglich einer Radeon.

Durchgang 1 = 2x sparce
Loop 1 = 4x sparce
Loop 2 = 6x sparce

Ausser Z/stencil kommt der erste Durchgang praktisch total Fuell-raten frei.

@AiL

NV4x hat dedizierte HDR HW und beherrscht das einfach schneller.

Und andere Loesungen realisieren HDR durch Software? Wer erzaehlt denn eigentlich solchen Quark?

http://www.techreport.com/reviews/2004q2/geforce-6800ultra/index.x?pg=26
http://www.techreport.com/reviews/2004q2/geforce-6800ultra/index.x?pg=27

Einen Schritt weiter:

http://www.techreport.com/reviews/2004q2/radeon-x800/index.x?pg=27

Und jetzt mal bitte eine gesunde Erlaeuterung wieso HDR (ohne float blending da dieses zu SM3.0 gehoert) wo genau schneller ist.

Nach meinen Infos hat jede NV2x/NV3x-Pipe zwei ROPs.

Hab ich das Gegenteil behauptet? (wenn ja dann war es ein dummer Ausrutscher). Es aendert aber nichts an der Tatsache dass loops mit MSAA genauso angewendet werden heute wie frueher; um das ging es.

In der Praxis kenne ich kein Spiel wo 3x MIMD VS annähernd limitieren könnten.
Kommt vieleicht aber noch..

MIMD hat Vor- und Nachteile. Sonst wuerden die Dinger IMHO noch mehr abheben. Ist wohl eher ein Blick seitens NV in ihre zukuenftige Architekturen.

Ich bin gespannt wie der NV44 aussehen wird, hoffentlich wird das nicht wieder so eine Krücke wie der NV31. SM3.0 unterstützung deutlich unter 100mio Transistoren ahoi

Kruecke oder nicht, es sieht mir eher nach dem low-end Bestseller aus fuer den naechsten Schub und das genau aus dem gleichen Grund wie beim NV31.

Ailuros

2004-09-23, 03:32:28

Am NV43 wurde wohl bewusst einiges gespart, auch um den Abstand zur 6800 zu haltne.

Schon vor der oeffentlichen Ankuendigung sagte ich dass ich dieses spezifische Modell nicht als high-end ansehe, egal wie die Spezifikationen oder der finale Preis aussieht. Es gibt zu viele Modelle diesmal bei NVIDIA; ich kann zwar verstehen dass es einen Zweck hat einen chip mit einem defekten quad auszunutzen, aber einen moeglichen NV41 und einen NV43 zur gleichen Zeit kann ich nicht verstehen.

Ein sehr starkes mainstream Teil auf der Spitze dieser Kategorie haette IMHO ausgereicht.

Robbitop@FH

2004-09-23, 13:28:48

Und andere Loesungen realisieren HDR durch Software? Wer erzaehlt denn eigentlich solchen Quark?

http://www.techreport.com/reviews/2004q2/geforce-6800ultra/index.x?pg=26
http://www.techreport.com/reviews/2004q2/geforce-6800ultra/index.x?pg=27

Einen Schritt weiter:

http://www.techreport.com/reviews/2004q2/radeon-x800/index.x?pg=27

Nicht dedizierte Hardware bedeutet nicht gleich Software (Umkehrschluss also falsch). ATi nutzt dazu bereits vorhandene Hardware, die sonst für andere Zwecke da ist.
NV hat hier eigene, die schneller ist.

Endorphine

2004-09-23, 13:42:43

[...]
Es gibt zu viele Modelle diesmal bei NVIDIA; ich kann zwar verstehen dass es einen Zweck hat einen chip mit einem defekten quad auszunutzen, aber einen moeglichen NV41 und einen NV43 zur gleichen Zeit kann ich nicht verstehen. So denke ich auch. :) Ich glaube immer noch daran, dass der NV41 nichts weiter wird als ein NV45 (= NV40 + HSI) mit einem deaktivierten Quad. Also eine 6800 non-ultra/non-gt mit HSI. Alles andere wäre wirtschaftlich nicht sonderlich schlau.

Schon allein von der Preisgestaltung her ist zwischen NV40/45 und NV43 überhaupt kein Platz für einen NV41, der mehr ist als ein 3-Quad NV45. Ich denke nicht, dass es profitabel ist, für ein winziges Marktsegment mit einer Preisspanne von 250 - 300 einen eigenen ASIC herzustellen.

Ailuros

2004-09-24, 01:43:17

Nicht dedizierte Hardware bedeutet nicht gleich Software (Umkehrschluss also falsch). ATi nutzt dazu bereits vorhandene Hardware, die sonst für andere Zwecke da ist.
NV hat hier eigene, die schneller ist.

Schneller wo? Die obrigen links zeigen ein techdemo in dem ATI 2x mal schneller abschlaegt als NVIDIA. Ein Beleg dass NV in diesem Fall schneller ist vielleicht?

http://www.techreport.com/reviews/2004q2/radeon-x800/x800-rthdr2.jpg

http://www.techreport.com/reviews/2004q2/geforce-6800ultra/6800-rthdr2.jpg

Was HDR mit float blending betrifft, ist es eine Affaere die zu keinen Vergleichen fuehrt, da hier SM3.0 vorrausgesetzt wird.

Wie dem auch sei HDR ist heutzutage moeglich auf SM2.0 oder hoeherer Hardware.

ShadowXX

2004-09-24, 08:59:26

Schneller wo? Die obrigen links zeigen ein techdemo in dem ATI 2x mal schneller abschlaegt als NVIDIA. Ein Beleg dass NV in diesem Fall schneller ist vielleicht?

http://www.techreport.com/reviews/2004q2/radeon-x800/x800-rthdr2.jpg

http://www.techreport.com/reviews/2004q2/geforce-6800ultra/6800-rthdr2.jpg

Was HDR mit float blending betrifft, ist es eine Affaere die zu keinen Vergleichen fuehrt, da hier SM3.0 vorrausgesetzt wird.

Wie dem auch sei HDR ist heutzutage moeglich auf SM2.0 oder hoeherer Hardware.

Die von die genannte Demo ist aber auch extrem auf ATI zugeschnitten....

Und warum klammerst du das float belending immer aus??? Nur weil die ATIs kein SM3.0 können???
Ausserdem bin ich der Meinung irgendwo (schon mehrmals) von aths gelesen zu haben, das das float blending und die dedizierten HDR Eigenschaften des nv40 nicht wirklich was mit SM3.0 zu tun haben....

Ich hab mit mehreren Leute drüber gesprochen (auch über diese Demo und nicht nur auf diesem Board)....viele sind der Ansicht, das man für halbwegs vernünftiges HDR float blending haben muss....

Zugegebenermassen kenne ich mich da nicht so 100%ig aus, aber die fast einhellige Meinung zu dem Thema war das das "HDR" des r3x0/r420 relativ gesehen schlecht ist....

Quasar

2004-09-24, 09:21:25

Es ist IMO ziemlich dasselbe, wie alles bei ATi (und das ist nicht negativ gemeint!): Was der Chip kann, kann er ziemlich schnell (siehe auch die HDR-Tests im ShaderMark v2.1).

BTW, die Vertex-Texture-Fetch-Einheiten im nV40 können auch nativ keine Texturfilterung - nur Point-Sampling - und trotzdem scheint man ein bissel was damit anfangen zu können.

ShadowXX

2004-09-24, 09:51:00

Ebenfalls BTW....Timbury ist eine sehr schöne HDR Demo für den nv40.

Läuft aber wohl unter OGL (bin mir aber nicht sicher...).

This odd man gives the NVIDIA® GeForce™ 6800 GPUs an opportunity to show that they are not only vertex and pixel shading powerhouses, but that their native floating point precision allows them to handle 32-bit or 16-bit floating point data with ease.

Key Features:

1. Lighting is calculated in Industrial Light and Magic's OpenEXR 16-bit floating point math, enabling a high dynamic range not available on older graphics hardware. He is lit by the environment as opposed to artificial point lights, directional lights, or spotlights..

2. The scene is rendered into 16-bit floating point render target that allows the scene to be blurred, and is used to calculate the user's pupillary response. This causes the scene to lighten and darken based on how much light is hitting the eye. A post-processing step allows the bright areas to bloom into bright spots in the final image..

3. Timbury's facial features are refracted through his thick glasses to amplify his emotions as he inspects what he believes to be a prime specimen of the icky genus..

4. Subdivision surfaces provide a dynamic level of detail for Timbury based on the viewer's position..

robbitop

2004-09-24, 10:13:45

danke shaddow
ich hätte es nicht besser ausdrücken können :)

Ailuros

2004-09-24, 12:01:18

Die von die genannte Demo ist aber auch extrem auf ATI zugeschnitten....

Quasar hat darauf schon geantwortet.

Und warum klammerst du das float belending immer aus??? Nur weil die ATIs kein SM3.0 können???
Ausserdem bin ich der Meinung irgendwo (schon mehrmals) von aths gelesen zu haben, das das float blending und die dedizierten HDR Eigenschaften des nv40 nicht wirklich was mit SM3.0 zu tun haben....

Entwickler werden HDR in absehbarer Zukunft einsetzen. Die Faelle die mir bis jetzt bekannt sind, setzen aber float blending voraus. HDR mit float blending ist nur auf jeglicher heutigen und zukuenftigen SM3.0 Architektur vorhanden.

Ich hab mit mehreren Leute drüber gesprochen (auch über diese Demo und nicht nur auf diesem Board)....viele sind der Ansicht, das man für halbwegs vernünftiges HDR float blending haben muss....

Und es gibt auch viele andere, unter diesen auch NVIDIA, dass HDR Qualitaet auch weiterhin gesteigert werden kann und es wird auch von allen kommen. Das heisst aber immer noch nicht dass Radeons nicht zu HDR faehig sind, dass es Entwickler nicht ausnutzen koennten oder dass NV in diesem Fall schneller ist.

CryTek arbeitet an einer HDR Implementation mit float blending fuer einen zukuenftigen patch; ob da noch was fuer ATI ins Spiel kommt weiss ich nicht. Aber der SM2.0_b path wurde fast (ja uebertrieben) ueber Nacht entwickelt. Nur weil hier den Entwicklern nicht bewusst war mehrere Lichter anstaendig zu optimieren.

Zugegebenermassen kenne ich mich da nicht so 100%ig aus, aber die fast einhellige Meinung zu dem Thema war das das "HDR" des r3x0/r420 relativ gesehen schlecht ist....

Das Featureset des R4xx ist nicht berauschend und das hab auch nie behauptet (deshalb hocke ich auch auf einer NV40). Das heisst aber auch wiederrum nicht dass die R4xx total nutzlos ist. Begrenzt ja, aber das was sie kann das kann sie auch extrem schnell realisieren; effektiv zweimal so schnell wie die R3xx. In dem Sinn ist die Debatte sinnlos; will ein Entwickler heute HDR in ein Spiel implementieren, kann er es mit beiden Architekturen, obwohl viele die Komplikation mehrerer paths wohl vermeiden werden und womoeglich gleich auf float blending setzen fuer die Zukunft, da selbst ATI es schon in der naechsten Generation verwenden wird.

Fuer Einhelligkeit koennte ich angeklagt werden, wenn ich stets nur eine Seite unterstuetzen wuerde.

aths

2004-09-24, 13:51:38

Entwickler werden HDR in absehbarer Zukunft einsetzen. Die Frage ist, ob nur für einige Spezialeffekte oder "durchgehend". Nvidia nennt die FP16-Schiene ja nicht umsonst HPDR – FP16 bietet eine feinere Abstufung von Farben. Du kennst vermutlich die Colorbanding-Probleme bei FX8. Die entstehen manchmal auch durch 8-Bit-Blending. Erst wenn man durchgehend FP16 einsetzt, kriegt man das weg. NV40 ist bei durchgehender FP16-Nutzung natürlich ziemlich träge (halbe Texturfilter-Performance, halbe Blending-Performance, und MSAA ist gleich gar nicht möglich.) Was "richtige" FP16-Unterstützung angeht, taugt der NV40 vielleicht so viel wie die TNT für den 32-Bit-Framebuffer.

Insofern erwarte ich in absehbarer Zukunft nur hier und da mal einen HDR-Effekt.

Die Faelle die mir bis jetzt bekannt sind, setzen aber float blending voraus. HDR mit float blending ist nur auf jeglicher heutigen und zukuenftigen SM3.0 Architektur vorhanden.

[QUOTE=Ailuros]Und es gibt auch viele andere, unter diesen auch NVIDIA, dass HDR Qualitaet auch weiterhin gesteigert werden kann und es wird auch von allen kommen. Das heisst aber immer noch nicht dass Radeons nicht zu HDR faehig sind, dass es Entwickler nicht ausnutzen koennten oder dass NV in diesem Fall schneller ist.

CryTek arbeitet an einer HDR Implementation mit float blending fuer einen zukuenftigen patch; Solches Alphablending ohne FP16-Alphablending muss umständlich mit einem Render2Texture-Verfahren realisiert werden. Kostet viel Bandbreite und kräftig Füllrate. Davon, Texturfilterung im Pixelshader nachzustellen, wollen wir gar nicht erst reden. Tonemapping ist bei der Radeon auch im Pixelshader und "von Hand" zu machen. Für primitive HDR-Effekte kann man die Radeon natürlich nehmen. Für durchgehende Nutzung muss die 6800 Ultra her, welche damit sicherlich keine fps-Rekorde aufstellt, aber um einige Faktoren schneller als die Radeon ist. Mit dem Angebot von FP-Filterung und FP-Blending sind Entwickler sicherlich viel einfacher davon zu überzeugen, HDR-Rendering zu machen, als wenn der Entwickler für die Radeon alles "von Hand" programmieren muss.

Dass es Demos gibt, wo HDR-Rendering auf der Radeon deutlich schneller ist als auf der GeForce 6 sagt gar nichts. Nutzen diese Demos den NV40 überhaupt in dem Umfang aus wie den R420? Man könnte auch Demos schreiben, die auf beiden Karten gleiche Bilder produzieren, wo es leistungsmäßig genau andersrum aussieht. R420 wurde nicht für HDR designt.

Leonidas

2004-09-25, 02:11:21

Muss ich Dir erlaeutern wie NVIDIA selber vorschlaegt dass man ihre Karten testen soll, wieso Treiber default auf "quality" gesetzt ist und wieso die Mehrzahl der Reviews meistens NUR quality benutzen?

Selbst die BQ-mäßig unbeanstandbare GF4Ti hat nur Quality, kein HQ. Ich sehe HQ als "Übermode".

Ailuros

2004-09-25, 04:10:45

Die Frage ist, ob nur für einige Spezialeffekte oder "durchgehend". Nvidia nennt die FP16-Schiene ja nicht umsonst HPDR – FP16 bietet eine feinere Abstufung von Farben. Du kennst vermutlich die Colorbanding-Probleme bei FX8. Die entstehen manchmal auch durch 8-Bit-Blending. Erst wenn man durchgehend FP16 einsetzt, kriegt man das weg. NV40 ist bei durchgehender FP16-Nutzung natürlich ziemlich träge (halbe Texturfilter-Performance, halbe Blending-Performance, und MSAA ist gleich gar nicht möglich.) Was "richtige" FP16-Unterstützung angeht, taugt der NV40 vielleicht so viel wie die TNT für den 32-Bit-Framebuffer.

Insofern erwarte ich in absehbarer Zukunft nur hier und da mal einen HDR-Effekt.

Kein einziger Einwand; hierbei moechte ich mich aber auf den letzten Satz konzentrieren: anders habe ich es auch nicht gemeint.

Es gibt genauso einen Grund warum ich 64bpp HDR irgendwo erwaehnte (fuer die etwas weitere Zukunft) und nein ich meinte hier nicht FP16.

Solches Alphablending ohne FP16-Alphablending muss umständlich mit einem Render2Texture-Verfahren realisiert werden. Kostet viel Bandbreite und kräftig Füllrate. Davon, Texturfilterung im Pixelshader nachzustellen, wollen wir gar nicht erst reden. Tonemapping ist bei der Radeon auch im Pixelshader und "von Hand" zu machen. Für primitive HDR-Effekte kann man die Radeon natürlich nehmen. Für durchgehende Nutzung muss die 6800 Ultra her, welche damit sicherlich keine fps-Rekorde aufstellt, aber um einige Faktoren schneller als die Radeon ist. Mit dem Angebot von FP-Filterung und FP-Blending sind Entwickler sicherlich viel einfacher davon zu überzeugen, HDR-Rendering zu machen, als wenn der Entwickler für die Radeon alles "von Hand" programmieren muss.

Wie fortschrittlich glaubst Du wird HDR in Far Cry als Beispiel genau sein? In solch einem Fall haette auch primitives HDR durchaus ausgereicht fuer die heutigen Verhaeltnisse. Wie sieht es mit HL2 aus?

Eine andere total irrelevante Frage: wieso setzt die U3 engine nicht wahres displacement sondern parallax mapping ein?

Dass es Demos gibt, wo HDR-Rendering auf der Radeon deutlich schneller ist als auf der GeForce 6 sagt gar nichts. Nutzen diese Demos den NV40 überhaupt in dem Umfang aus wie den R420? Man könnte auch Demos schreiben, die auf beiden Karten gleiche Bilder produzieren, wo es leistungsmäßig genau andersrum aussieht. R420 wurde nicht für HDR designt.

Es macht aber trotzdem den praesentierten Effekt im Demo nicht nutzlos.

Uebrigens der einzige Grund warum dieses spezifische demo langsamer auch auf NV3x laueft, ist dass nicht alle float Formate unterstuetzt wurden. Ich hab keine Ahnung ob Techreport recht hat, dass sich da was geaendert hat fuer NV4x und das spezifische Demo, auf jeden Fall werden bei NV4x immer noch nicht alle float Formate unterstuetzt.

Natuerlich ist das mehr oder weniger irrelevant; ich hab mich schon des oefteren darueber geaeussert dass es besser ist fuer die Entwickler fruehzeitig Features freizustellen und dem Sinn kann ich NVIDIA fuer den NV40 nur applaudieren. Zumindest koennen diese momentan schon anfangen SM3.0 Effekte in Spiele zu implementieren.

Das heisst aber wiederrum auch nicht dass jegliche Implementierung was Hardware betrifft jetzt auch unbedingt ideal ist auf der NV40.

Ailuros

2004-09-25, 04:21:21

Selbst die BQ-mäßig unbeanstandbare GF4Ti hat nur Quality, kein HQ. Ich sehe HQ als "Übermode".

(NV25 hat auch um einiges weniger Filterungs-Optimierungen).

Ja und nein. Wenn mir ein Spiel keinen einzigen Seiten-effekt ergibt, dann benutze ich natuerlich "quality" auf der NV40. In jedem anderen Fall muss ich entweder eine oder alle Optimierungen abschalten.

Wenn es um so moeglich wie objektive Leistungs-Messungen gehen sollte, muesste ich auch unter Umstaenden diese Kleinigkeiten in Betracht nehmen.

Von dem abgesehen NVIDIA muss um jeden Preis den aeusserst stoerenden aliasing-bug loswerden, der sogar in "high quality" erscheint.

robbitop

2004-09-25, 09:39:32

Leo wenn HQ für dich schon ein Übermode ist, was ist denn die Filterung der NV20/25? (Ausserirdisch? ;))

Ailuros

2004-09-25, 13:06:33

Leo wenn HQ für dich schon ein Übermode ist, was ist denn die Filterung der NV20/25? (Ausserirdisch? ;))

Winkelabhaengigkeit, brilinear etc etc. zur Seite, NV2x hat aber auch wiederum quasi zu viel gefiltert, was nur heissen soll dass Apaptivitaet nicht so fortschrittlich war wie in Nachfolgern.

robbitop

2004-09-26, 03:49:01

Winkelabhaengigkeit, brilinear etc etc. zur Seite, NV2x hat aber auch wiederum quasi zu viel gefiltert, was nur heissen soll dass Apaptivitaet nicht so fortschrittlich war wie in Nachfolgern.

auch wenn aths das nicht so sehen sollte: full ack.
Ich kann das eh nicht wahrnehmen und kann die gewonnene Performance anderwaltig investieren, in Dinge, die ich wahrnehme.

Ailuros

2004-09-26, 04:30:29

Ich hab damit auch nicht Winkel-abhaengigkeit gemeint um ehrlich zu sein.

Ein "normales" adaptives AF Verfahren entscheidet sich mal ganz vereinfacht ob eine Textur kein, 2x, 3x, 4x AF etc braucht und wendet eben den demenstrechenden Wert von AF an.

Ich denke schon dass es schon Fortschritte diesbezueglich im NV2x gab, aber fortschrittlichere Aenderungen kamen dann wohl eher mit der NV3x Familie. Es ist schon sehr lange her, aber wenn ich mich nicht irre wendete der NV20 mit den ersten Treibern eher eine "sture" Anzahl von samples an. 8xAF hiess da wohl eher volle 8xAF samples auf allen Texturen.

Der letzte Fall ist natuerlich total redundant und eine kluge und um einiges schnellere Methode die zu keiner Qualitaets-Reduzierung fuehrt, sollte man eher als optimaler ansehen und ich bezweifle dass selbst aths was dagegen einzuwenden hat.

Waere es moeglich heutzutage adaptives AA einzusetzen (etwa mit der obrigen Logik) haette ich noch mehr Grund zum Jubeln. Vielleicht kommt's noch, aber es ist noch zu frueh und es waere vielleicht auch besser wenn Entwickler ihre Spiele in dem Fall mit AA im Hinterkopf entwickeln wuerden und es der Applikation ueberlassen.

robbitop

2004-09-26, 10:49:10

hrn ob das so reibungslos auch in der Praxis läuft, wage ich zu bezweifeln.

ShadowXX

2004-09-26, 12:02:30

Von dem abgesehen NVIDIA muss um jeden Preis den aeusserst stoerenden aliasing-bug loswerden, der sogar in "high quality" erscheint.

Welchen AA-Bug meinst du??? (Ich weiss es momentan wirklich nicht, soll keine "anmache" sein.)

Filter @ Scanout???

Xmas

2004-09-26, 15:45:39

Ich denke schon dass es schon Fortschritte diesbezueglich im NV2x gab, aber fortschrittlichere Aenderungen kamen dann wohl eher mit der NV3x Familie. Es ist schon sehr lange her, aber wenn ich mich nicht irre wendete der NV20 mit den ersten Treibern eher eine "sture" Anzahl von samples an. 8xAF hiess da wohl eher volle 8xAF samples auf allen Texturen.
Das war definitiv weder bei NV1x noch bei NV2x jemals der Fall (bei nachfolgenden erst recht nicht).

Ailuros

2004-09-26, 20:40:07

Welchen AA-Bug meinst du??? (Ich weiss es momentan wirklich nicht, soll keine "anmache" sein.)

Filter @ Scanout???

Textur-aliasing bug; es gibt einen Thread bei B3D darueber. Es hat nichts mit MSAA zu tun und wohl auch nicht mit AF.

ShadowXX

2004-09-26, 20:46:05

Textur-aliasing bug; es gibt einen Thread bei B3D darueber. Es hat nichts mit MSAA zu tun und wohl auch nicht mit AF.

Thanxx...werd ihn mir gleich mal durchlesen....

Ailuros

2004-09-26, 20:58:40

Das war definitiv weder bei NV1x noch bei NV2x jemals der Fall (bei nachfolgenden erst recht nicht).

Dass ab NV3x AF intelligenter angewendet wurde, hab ich auch keine Zweifel:

http://www.digit-life.com/articles2/behind-intellisample/index.html

So, what makes the driver use exactly the most roughest table for our application? The peculiarity of our test is that it consists of a uniform texture. So, the maximum anisotropy level now depends on the contents of the texture filtered. Well, the programmers are right: why to make the GPU average colors of 32 texels to form the final texture color if the texel colors are the same, and averaging of 4 textures from the standard bilinear sampling brings the same result? Now the Intellisample algorithms of the OpenGL can be considered intelligent indeed, because the driver calculates the sharpness degree for each texture at the texture creation stage, and it is the sharpness degree which is used as an index of the anisotropy optimization tables.

Ailuros

2004-09-26, 21:00:49

Thanxx...werd ihn mir gleich mal durchlesen....

Um Dir die Sucherei zu sparen:

http://www.beyond3d.com/forum/viewtopic.php?t=16196