Archiv verlassen und diese Seite im Standarddesign anzeigen : GeForce 6600GT und ROP-Schwächen + 4x2 Pipeline-Modus
GeForce 6600GT
2005-05-22, 20:40:17
Hallo!
Die GeForce 6600GT hat ja 8 Pixelpipelines mit nur 4 ROP's Einheiten.
Ist das den kein Flaschenhals?
Allerdings soll sie auch anstatt im 8x1(Pipeline-) Modus auch im 4x2(Pipeline-) Modus laufen.
Verliert sie dadurch nicht an Performence (Geschwindigkeit)?
Und wie funktioniert der 4x2 (Pipeline-) Modus?
Kann mir das jemand mal genau erklären?
Danke für alle Antworten!
Grüße
GeForce 6600GT
Das ist nur ein Flaschenhals bei Singletexturing und anderen Sachen wo bei jedem Takt ein Pixel aus den Pixelpipelines kommt. Sowas ist heute aber sehr selten.
Man wird also wirklich nur bei sehr alten Spielen einen Unterschied bemerken wo die Leistung sowieso nicht gebraucht wird. Naja, abgesehen von Stencilshadows, aber da können die ROPs auch 2 Pixel pro Takt ausgeben womit man wieder bei 8 wäre.
Allerdings soll sie auch anstatt im 8x1(Pipeline-) Modus auch im 4x2(Pipeline-) Modus laufen.Das ist falsch und trifft nur auf die GeForce FX zu.
die 6600GT hat "echte" 8x1 pipelines.
durch die 4 ROPs enstehen nur nachteile wenn jede pipeline in jedem takt ein pixel fertigstellt, was aber bereits bei trilinearer texturfilterung nicht mehr möglich ist, von anisotropem filter und aufwendigen shader ganz zu schweigen.
kleinere nachteile könnte es dann noch bei 4xFSAA geben, da die ROPs für 4 subpixel 2 takte brauchen.
damit es dann keinen "stau" in der pipeline gibt müsste man pro pixel schon 4 takte brauchen (2x Tri AF oder höher)
allerdings limitiert da dass speicherinterface mit 128bit.
kleinere nachteile sollte es auch bei spielen mit einem z-first-pass geben, da die rops aber immerhin je 2 zixel bearbeiten können hält sich auch dieser nachteil in grenzen.
Quasar
2005-05-22, 23:17:27
Man wird also wirklich nur bei sehr alten Spielen einen Unterschied bemerken wo die Leistung sowieso nicht gebraucht wird. Naja, abgesehen von Stencilshadows, aber da können die ROPs auch 2 Pixel pro Takt ausgeben womit man wieder bei 8 wäre.
Ja, allerdings könnte man mit acht ROPs hier eben 16 Z-/Stencil-only Pixel/Takt ausgeben.
Das ist falsch und trifft nur auf die GeForce FX zu.
B3D ("suggests") war sich dafür aber nicht zu schade und ATi hat's dankend in einem ihrer PDFs zitiert. :)
Wenn man eine Pipeline als den Weg eines Pixels von seiner "Enstehung" bis in den Framebuffer ansieht, ist das auch durchaus legitim so.
Dann hätte die GF6600 sehr wohl vier Pipelines, jede aber mit enormer Rechenkraft. ;)
GeForce 6600GT
2005-05-23, 00:08:40
Danke soweit an alle! :-)
"die 6600GT hat "echte" 8x1 pipelines."
Heißt das, dass sie doch die 4000MPix/s / 4000MTex/s an Füllrate schafft?
Oder hat sie doch nur die 2000MPix/s / 2000MTex/s an Füllrate?
B3D ("suggests") war sich dafür aber nicht zu schade und ATi hat's dankend in einem ihrer PDFs zitiert.
Wenn man eine Pipeline als den Weg eines Pixels von seiner "Enstehung" bis in den Framebuffer ansieht, ist das auch durchaus legitim so.
Dann hätte die GF6600 sehr wohl vier Pipelines, jede aber mit enormer Rechenkraft. Es gibt schon noch einen Unterschied zwischen 4x2 und 8x1 mit 4 ROPs.
4x2: 4 ALUs, 4 ROPs, 8 TMUs
8x1 mit 4 ROPs: 8 ALUs, 4 ROPs, 8 TMUs
Und die ROPs limitieren niemals so wie weniger Shaderleistung. ATi ist doch nur neidisch auf das schön flexibel skalierbare NV40 Design ;)
Heißt das, dass sie doch die 4000MPix/s / 4000MTex/s an Füllrate schafft?
Oder hat sie doch nur die 2000MPix/s / 2000MTex/s an Füllrate?Sie hat wirklich weniger Single-Texturing Füllrate. Allerdings fällt das absolut nicht ins Gewicht in heutigen Spielen.
Sobald auch nur 2 Takte pro Pixel gebraucht werden z.B. bei Multitexturing (gab's schon in Quake 1) ist der Nachteil weg.
Die Benchmarks sagen ja auch das gleiche. Eine Radeon 9800 Pro müsste sonst ja deutlich schneller sein als eine 6600GT.
Ich stimme der harten B3D-Auslegung zu. Die GF 6600 kann pro Takt nur höchstens 4 Pixel fertigstellen. Also hat sie keine 8 Pixelpipelines. Von einer 4x2-Architektur zu sprechen halte ich aber auch für nicht zutreffend, sondern für Ausdruck traditionellen Denkens.
Mich interessiert als Endkunde eh nicht wie viele Pipes ein Chip hat, sondern was der Chip als Ganzes zu leisten vermag.
robbitop
2005-05-23, 15:08:14
Mich interessiert als Endkunde eh nicht wie viele Pipes ein Chip hat, sondern was der Chip als Ganzes zu leisten vermag.
Die Leistung der GT ist relativ zur Konkurenz (6800NU und X700pro) doch sehr ordentlich.
zeckensack
2005-05-23, 17:38:47
B3D ("suggests") war sich dafür aber nicht zu schade und ATi hat's dankend in einem ihrer PDFs zitiert. :)
Wenn man eine Pipeline als den Weg eines Pixels von seiner "Enstehung" bis in den Framebuffer ansieht, ist das auch durchaus legitim so.
Dann hätte die GF6600 sehr wohl vier Pipelines, jede aber mit enormer Rechenkraft. ;)Nicht ganz. Wenn man einen Graphen zeichnet mit "Rechenaufwand pro Pixel in Takten" vs "Durchsatz" ist dieser
a)bei Betrachtung der Texturleistung bei einem 4x2-Design "stufiger", bei einem 8x1-Design "glatter"
b)bei Betrachtung der Shaderleistung ... nun, das was hier dazu schon geäußert wurde setzt voraus dass ein 4x2-Design nur "eine ALU pro Pipe" hat, was man so aber nicht verallgemeinern sollte. IMO haben nämlich zB NV1x/NV2x zwei (Integer-ALUs natürlich, in dem Fall). Deswegen betrachte ich jetzt mal nur die Texturleistung.
Zwecks Breitenminimierung der Tabelle: "Ts" steht für die Anzahl der Texturen (bilinear, kein AF), "P/T" soll "Pixel pro Takt" bedeuten.
Ts | P/T intern | P/T "hinten raus"
---------------------------------
1 | 8 | 4 8x1/4 ROPs
2 | 4 | 4
3 | 8/3 | 8/3
4 | 2 | 2
5 | 8/5 | 8/5
6 | 4/3 | 4/3
7 | 8/7 | 8/7
8 | 1 | 1
1 | 4 | 4 4x2/4 ROPs
2 | 4 | 4
3 | 2 | 2
4 | 2 | 2
5 | 4/3 | 4/3
6 | 4/3 | 4/3
7 | 1 | 1
8 | 1 | 1
8x1 ist im Mittel einfach effizienter, trotz ROP-Limitierung.
B3D hat das IIRC sogar selbst nachgemessen (Rightmark 3D, Texturfüllrate?).
Das ganze jetzt mit Tri-/Brilinear und Shadern zu verdeutlichen wäre ziemlich kompliziert. Trotzdem bleibt eben das Parhelia-Syndrom festzuhalten: wenn man eine Pipeline sehr lang baut, hängen die Einheiten "hinten dran" in vielen Situationen ungenutzt rum. Deswegen sind mehr, und dafür entsprechend kürzere Pipelines besser.
Hast einen Zahlendreher in Zeile 7 des 8x1 Setup, das muss 8/7 sein und nicht 7/8.
Quasar
2005-05-23, 22:31:08
Es gibt schon noch einen Unterschied zwischen 4x2 und 8x1 mit 4 ROPs.
4x2: 4 ALUs, 4 ROPs, 8 TMUs
8x1 mit 4 ROPs: 8 ALUs, 4 ROPs, 8 TMUs
B3Ds 4x2 hätte aber so ausgesehen:
8 ALUs, 8 TMUs, 4 ROPs - so wie dein 8x1 - aber eben definiert durch den kleinsten vorkommenden Faktor, in diesem Falle die ROPs.
Nicht ganz. [...]
Ich bewerte das doch gar nicht - und noch viel weniger hätte ich dem widersprochen, was du generell angeführt hast.
Es ist und bleibt eben eine Frage, was man als "Pipeline" definiert.
Nach dieser strengen Definition hat selbst eine XBox 360-GPU nur acht Pipelines - jede mit enormer Rechenkraft und der Fähigkeit, single-pass 4xAA zu liefern.
zeckensack
2005-05-23, 22:45:56
Hast einen Zahlendreher in Zeile 7 des 8x1 Setup, das muss 8/7 sein und nicht 7/8.Gefixt :)
Ich bewerte das doch gar nicht - und noch viel weniger hätte ich dem widersprochen, was du generell angeführt hast.
Es ist und bleibt eben eine Frage, was man als "Pipeline" definiert.
Nach dieser strengen Definition hat selbst eine XBox 360-GPU nur acht Pipelines - jede mit enormer Rechenkraft und der Fähigkeit, single-pass 4xAA zu liefern.Auch wieder wahr.
Ich wollte eigentlich nur der vermeintlichen 4x2-Organisation entgegentreten (bzw der Behauptung das würde keinen Unterschied machen), auf die du über zwei Ecken geantwortet hast.
naja, 8x1 mit 4 ROPs ist eigentlich bei einer ungeraden anzahl verwendeter texturen immer effizienter als 4x1 mit 4 ROPs
naja, 8x1 mit 4 ROPs ist eigentlich bei einer ungeraden anzahl verwendeter texturen immer effizienter als 4x1 mit 4 ROPsDu meinst wohl 4x2 mit 4 ROPs, oder?
vBulletin®, Copyright ©2000-2025, Jelsoft Enterprises Ltd.