PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : NV30 Effizienz


Mad-Marty
2002-11-20, 10:40:45
Hallo,


ok, ich verstehe den punkt mit der 4:1 compression so das
bei 2x FSAA kaum performance verloren geht durch
RAM bandbreitenprobleme.

Aber wie siehts mit dem Chip aus, der muss doch trotzdem
die 4fache Füllrate bringen ...... [bei 2x] ???

Reichen die 500 Mhz am Ende doch nicht für FSAA4Free ???


Nunja, schön das die ATI kritiker sich wenigstens plötzlich
nicht mehr über externe Stromanschlüsse und grosse Kühler aufregen. :-p

Aber mal ehrlich, aus technischer sicht hat der Stromanschluss doch
nur Vorteile bezüglich Stromversorgung und Spannungsstabilität.

Welche Leitung zapft er an ? 5v oder 12v ?
12V wären bei einem Athlon Sys sehr günstig, bei einem P4 dann lieber 5V, weil der Athlon ja die 12 V kaum auslastet.

Die Kühlung finde ich ebenfalls nicht falsch, da
der 1. Slot im allgemeinen sowieso unnutzbar ist.
- shared mit AGP meistens
- temperaturabstrahlung der GraKa

bye

Demirug
2002-11-20, 10:55:56
Mad-Marty:

Wo das FSAA Leistung kostet kommt im wesentlichen auf die Methode an. Beim Multisample wird nur Speicherbandbreite verbraucht. Das will NVIDIA ja mit der compression ausgleichen. Beim Supersampling kostet es zusätzlich auch Fillrate. Der wesentliche (bekannte) unterschied zwischen dem NV30 und dem R300 ist das NV30 4 AA-Samples pro Pipe erzeugen kann und der R300 6 AA-Samples. Das bedeutet das der NV30 bei allen AA-Modies mit mehr als 4 Samples pro Pixel auf jeden Fall einen Supersampling anteil braucht. Wie gross dieser allerdings ist kann ich nicht sagen.

Exxtreme
2002-11-20, 11:09:36
@ Demirug

Auch MSAA zieht Füllrate nur bei Weitem nicht so viel wie SSAA. Wenn man laut Matrox nur ca. 5% des Bildes zum Glätten braucht, diese 5% aber mit 6-fachen Aufwand bei 6x FSEAA berechnet, dann kommt schon was zusammen.

Demirug
2002-11-20, 11:19:06
Exxtreme,

ja du hast recht auch beim MSAA kommt ein gewisser Fillrate Anteil dazu. Deine Rechnung stimmt aber nicht ganz. Denn er steigt nicht linear zu der Sampleanzahl.

Der Mehraufwand ergibt sich aus der Anzahl der Pixel die mehr als ein Polygon enthalten. Dabei spielt dann aber nicht die Anzahl der Samples eine Rolle sonder wie viele Polygone sich in dem Pixel schneiden. 3dlabs hat das mal untersucht und ist zu dem Ergebniss gekommen das sich in den meisten Fällen nur 2 oder 3 Polygone in einem Pixel schneiden. Wobei wie du ja schon aufgeführt hast die meisten Pixel nur ein Polygon enthalten.

Mad-Marty
2002-11-20, 15:09:28
ok,
FSAA ist damit gut geklärt :-) thanx

Eine Frage hab ich trotzdem noch, gibt es wenn der RAM bandbreitenanteil rausfällt noch chiplimitierung ?
mehr clocks pro pixel oder liegt die performance wirklich ausschlieslich am RAM Bandbreitenproblem ?
Dann könnte es ja fast ein FSAA4Free werden oder ?

wie siehts mit dem Rest aus ? wie z.B. Stromversorgung-
welche Spannungen ?

Mad-Marty
2002-11-20, 15:17:23
[FSAA4FRee natürlich nur wenn wie die 4:1 der
Realität entsprechen und nicht nur sinnlos geblubber sind]

Naja mal sehen wenn aus dem Paperlaunch erste echte tests kommen

Demirug
2002-11-20, 15:19:51
Ja, wenn die 4:1 kompression wirklich gut funktioniert läst sich wohl ein FSAA fast umsonst erreichen. Aber warten wir mal ein Benachmarks ab.

egdusp
2002-11-22, 00:36:35
Neben der Effizienz der Kompression bei AA interessiert mich der evtl. Nutzen bei Nutzung von 64 oder 128 bit Farben.
Da wohl auch bei diesen Farbtiefen die Kompression automatisch erfolgt, erwarte ich einen nur geringeren Bandbreitenverlust als die Verdoppelung erwarten lassen würde.

Also z.B. die Umschaltung von 32 bit auf 64 bit würde nur 30% mehr Bandbreite fressen, da sich große Zahlen besser komprimieren lassen.

In welcher Größenordnung wäre ein solcher Bandbreitenspareffekt zu erwarten?

Kann das der R300 auch?

mfg
egdusp

Demirug
2002-11-22, 07:29:42
@egdusp:

"bis zu 4:1" bleibt erst mal "bis zu 4:1". Ob das Kompressionsverfahren allerdings bei der Verwendung von 32 oder 64 Bit Buffern eine bessere durchschnittliche Kompresion erreicht ist schwer zu sagen weil man ja nicht weiss wie NVIDIA genau komprimiert.

Wobei das IMO in diesem Fall sowieso eher eine untergeordnete Rolle spielen dürfte da man die 32 und 64 bit (pro Farbkanal) Buffer bei Spielen sowieso nur für Spezialaufgaben einsetzen wird. In der Regel sollten die 10:10:10:2 Backbuffer vollkommen ausreichen. Die Fliesspunktgenauigkeit wird primär nur in der Pixelpipline gebraucht um Fehler die durch den begrenzten Wertbereich der Integerpipeline entstehen zu verhinern.