PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Die ROPs des G80


robbitop
2007-01-08, 14:07:02
Dieser Thread ist ein Split aus R600 bzgl der G80 ROPs


beinahe zwangsläufig, wenn man bedenkt, dass evtl. die Blender komplett orthogonal auch auf Skalar-Basis rechnen.
...


Könntest du das ein wenig ausführen?
Ich wüsste nicht wo alphablender groß von skalarer behandlung profitieren. Beim Alphablending (was ja nichts anderes als 1xLERP ..also 1xMUL und 2xADD ist) braucht man zwangsweise RGB von einem Pixel im FB gleichzeitig. Eine "skalare" Ansteuerung hingegen würde nur Steuerungslogik kosten.

Wie kommst du auf diese These?


Fiel mir nur grad mal so ein und würde doch passen bei der Skalar-Ausrichtung des G80. Anstatt zwangsweise RGBA zu schreiben könnte man damit (und mit den entsprechenden Anpassungen) ja auch beliebige Kombinationen schreiben, zum Beispiel viermal soviele "Skalare" gleicher Bittiefe.


Es bringt (wie eine skalare Ausrichtung von TMUs z.B) aber gegenüber Blendern mit SIMD Vec3 Komponte hier keinen Vorteil und würde nur zur Verschwendung von Transistoren führen. Wie gesagt, für Alphablending brauche ich für jedes Pixel eh die RGB Werte und zwar gleichzeitig


Vielleicht können die Einheiten in den ROPs (ich sage jetzt mal absichtlich nicht Blender) ja auch mehrfach genutzt werden? Alphablending oder eben zusätzliche Z-Werte zu den normalen Z-Einheiten.

Meine Tests mit Z-Overdraw könnten in diese Richtung deuten - müssen es aber nicht.


Die Z-Test Units sind andere Units als die Blender. Die gehören aber beide in die ROPs.

Was sagen denn deine Z-Ovdraw Tests, wenn man fragen darf?


Vielleicht hat Nvidia eine Möglichkeit gefunden, da Transistoren mehrfach zu nutzen? Ich weiß es nicht.


Ich sehe darin noch immer keinen Vorteil.

Gast
2007-01-08, 14:33:22
Ich sehe darin noch immer keinen Vorteil.
Wenn es so ist, wäre der Vorteil, dass du mit ein und denselben Recheneinheiten (eventuell etwas erweitert) verschiedene Aufgaben erledigen könntest.

Ich habe die Ergebnisse hier (http://www.pcgameshardware.de/?menu=050000&s=thread&bid=3134&tid=5384970&x=1) bereits schonmal gepostet.
Ohne viel Text:


Zum Beispiel deuten diese Werte, die ich im Rahmen des Geforce-8-Tests mit den Release-Treibern gewonnen habe, darauf hin, dass Early-Z-Rate bzw. Z-/Stencil-Operationen ziemlich gut mit dem Faktor von 2-AA-Samples (4xAA halbiert, 8xAA viertelt die Werte) skalieren.

Z-Overdraw (nonatainment-Tool)
kein FSAA 0 Tex
1.024x768 38.007
2.560x1.600 38.623

2x FSAA 0 Tex
1.024x768 27.170
2.560x1.600 27.253

4x FSAA 0 Tex
1.024x768 20.650
2.560x1.600 8.097

8x FSAA 0 Tex
1.024x768 10.821
2.560x1.600x16 5.840
2.560x1.600 2.729
Ergebnisse in verworfenen Megapixeln/Sek.

Bei 2.560 und 4xAA geht wohl ein Zwischenspeicher aus...

Passend dazu:FableMark (PoweVR)
kein FSAA 4x FSAA 8x FSAA
1.024x768 279 159 90
1.600x1.200 123 74 42
2.560x1.600 59 29 13
Ergebniss in Fps

Das alles könnte allerdings auch noch ein reines Treiberproblem sein.

seahawk
2007-01-08, 14:38:44
Hm, bemerkenswert. In 1024 ist dass eine fast lineare Abnahme mit zunehmend MSAA Grad.

robbitop
2007-01-08, 15:33:58
Naja ich sehe erstmal nichts Besonderes an diesen Werten.
MSAA nutzt die Z-Test Units in den ROPs natürlich. Diese nutzt du entweder zum schreiben oder zum lesen von Pixeln aus dem Framebuffer. Mit MSAA hast du mehr Last auf denen, so dass weniger getestet und verworfen werden kann.
Das wird beim Villagemark auch "reinhauen".

Ich weiß aber immernoch nicht, was das mit den Blendern zu tun hat.

Gast
2007-01-08, 16:35:03
Ganz so normal ist es nicht. Beim G70 oder R580 ist diese Reaktion bei weitem nicht so ausgeprägt.



Hier noch dein VM:
VillageMark D3D
HQ kein FSAA 2x FSAA 4x FSAA 8x FSAA
640x480 1.275 1.038 1.246 854
1.024x768 957 703 884 455
1.600x1.200 546 377 494 220
8xAA fällt natürlich ab, weil die ROPs da erstmals loopen müssen.


Q

robbitop
2007-01-08, 16:59:50
Hast du denn vergleichbare G70/R580 Werte?

Achja: was hat das mit den Blendern zu tun? Ich sehe nur Benches im Zusammenhang mit den Z-Test Units.

DrumDub
2007-01-08, 17:03:24
wuz? 2xfsaa ist ja völlig sinnlos im villagemark.

LovesuckZ
2007-01-08, 17:08:08
wuz? 2xfsaa ist ja völlig sinnlos im villagemark.

Und in ganz vielen anderen Anwendungen auch. :)
Da die ROPs für 4 Samples nicht loopen müssen, gibt es keinen Geschwindigkeitsunterschied mehr.
Im Naturetest ist 4xMSAA sogar schneller als 2xMSAA und der skaliert prächtig mit der Speicherbandbreite.

greg
2007-01-10, 01:26:53
Hm, bemerkenswert. In 1024 ist dass eine fast lineare Abnahme mit zunehmend MSAA Grad.
du meinst beim Z-Overdraw (nonatainment-Tool)?

Coda
2007-01-10, 01:47:58
Langsamer sollte 2x trotzdem eigentlich nicht sein... Die Treiber haben wirklich noch viele Merkwürdigkeiten.

robbitop
2007-01-10, 09:17:51
Mit 2xMSAA kann G80 2x soviele Z-Tests durchführen, wie mit 4xMSAA und dazu ist mehr Bandbreite vorhanden. 2xMSAA sollte eigentlich schneller sein als 4xMSAA. Ich tippe ebenfalls auf merkwürdige Treiber.

PCGH_Carsten
2007-01-10, 11:43:11
Ich weiß aber immernoch nicht, was das mit den Blendern zu tun hat.

Meines Wissens wird bei allen Tests auch geblendet.

robbitop
2007-01-10, 12:35:39
Was haben die Blender mit den Z-Test Units zu tun?
Von Blending habe ich in den Tests auch noch nichts sehen können. Nichts, was einen Flaschenhals herausbilden könnte jedenfalls.

Btw: netter Avatar ;)