PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : AMD/ATI - R700 im Q2 2008, multicore und 55 nm? Teil 3


Seiten : 1 2 [3] 4

w0mbat
2008-06-06, 23:35:03
Ja, das höhere Taktdelta. Sind aber doch <50MHz beim RV670, oder. Um wieviel muss man eigentlich die RV670 ALUs verbessern um beim RV770 auch über 1 TFLOP zu kommen?

Gast
2008-06-06, 23:35:58
die 4870xt kann sich doch nie und nimmer mit 30% gegenüber der 4850 absetzen außer in extrem auflösungen wo dann die speicherbandbreite zum tragen kommt.

Gast
2008-06-06, 23:36:16
Eine konkrete Transistorzahl ist meines Wissens aber auch noch nicht bekannt, wobei man natürlich aufgrund der Chipfläche von 256 mm^2 ein wenig schlussfolgern kann, dass es um die 800 Millionen werden...

AnarchX
2008-06-06, 23:39:48
Um wieviel muss man eigentlich die RV670 ALUs verbessern um beim RV770 auch über 1 TFLOP zu kommen?
640 MADD-SPs @ 782MHz?

Aber wenn ich Ailuros' Andeutungen @B3D lese, dann sind es wohl nicht mehr 5SPs pro ALU?

w0mbat
2008-06-06, 23:42:45
Ich bin nich so der GPU-Design-Fachmann, deshalb sagt mir sowas wie 5SPs/ALU nichts.

Ailuros
2008-06-06, 23:43:34
Damit man wenigstens spekulativ auf etwas kommen kann waere es angebracht erstmal mit der Anzahl der clusters anzufangen. Dieses SP Gewarkel verwirrt eigentlich nur. Und nein es ist nicht Vec4+scalar afaik.

Ailuros
2008-06-06, 23:47:27
Ich bin nich so der GPU-Design-Fachmann, deshalb sagt mir sowas wie 5SPs/ALU nichts.

R6x0/RV6x0=

64 ALUs wobei vereinfacht pro ALU Vec4+ scalar MADD.

MADD = MULTIPLY + ADD = 2 floating point Ops oder FLOPs
Vec4 MADD (4*2) = 8 FLOPs
scalar MADD (1*2) = 2 FLOPs

64 ALUs * 5 = 320 SPs

64 ALUs * 10 FLOPs * 0.775 = 496 GFLOPs/s (RV670)

w0mbat
2008-06-06, 23:47:33
RV670 hat doch 4 Cluster mit jeweils 16v5 SPs, oder?

Ailuros
2008-06-07, 00:00:27
RV670 hat doch 4 Cluster mit jeweils 16v5 SPs, oder?

Das was Du als "V5" bezeichnest kann nur entwender Vec4+scalar oder 5*scalar sein. ATI bezeichnet die Dinger als "superskalar" was aber auch nicht unbedingt stimmt. Fuer eine Vereinfachung ist Vec4+scalar besser angebracht IMHO.

deekey777
2008-06-07, 00:02:14
Wie wär's damit: Der R600 besteht aus vier Kernen mit je 5 parallelen Vec16-ALUs. Ist richtig und sehr einfach zu verstehen.

Ailuros
2008-06-07, 00:10:45
Wie wär's damit: Der R600 besteht aus vier Kernen mit je 5 parallelen Vec16-ALUs. Ist richtig und sehr einfach zu verstehen.

...und wie willst Du dann G80 beschreiben? 8 Vec16 oder 16 Vec8 ALUs? Klar gehen Vereinfachungen nicht in Einzelheiten ein, aber es ist eben nicht Vec16 vs. Vec16 zwischen den beiden Architekturen, weil man sonst automatisch den Unterschied in Effizienz uebersieht.

Welche Architektur der beiden lastet seine ALUs besser aus bei nicht handgemeisterten Ausnahme-Faellen?

Gast
2008-06-07, 00:13:16
mal ne frage an die technikabteilung,wenn die kaum erneuerungen hat wie soll das was hier steht stimmen? oder ist das nur wieder müll von fud

http://www.fudzilla.com/index.php?option=com_content&task=view&id=7769&Itemid=1

The cards will end up quite fast, much faster than previous RV670 cards, especially with FSAA and Aniso turned on, as RV770 does Anti-aliasing the way it should and not via Shaders (as was the case with RV670).

We heard 1.5 times faster is the number that should appear, at least in the most optimistic case.

AnarchX
2008-06-07, 00:15:00
...

At least 3 ATI partners said that the Radeon HD 4870 is not ready for launch anytime soon, and if anyone was showing one off, it would have to be a mechanical mockup.
http://www.techarp.com/showarticle.aspx?artno=550&pgno=0

AnarchX
2008-06-07, 00:29:05
Besides the point that the most important thing about it is that RV700 truly should yield a theoretical peak of ~1 TFLOP/s
http://forum.beyond3d.com/showpost.php?p=1172085&postcount=2709

96x (2x Vec3 MADD + 1x scalar MADD) = 1008GFLOPs?

Ailuros
2008-06-07, 00:30:52
Lass mal die Finger weg von den angeblichen 480SPs und versuchs nochmal mit dem anderem Geruecht.

AnarchX
2008-06-07, 00:33:29
Also lagen Chiphell mit ihren 800SPs doch richtig?

Kriton
2008-06-07, 00:33:31
Es wundert mich ein wenig, dass sie den Launch-Termin nach hinten verschieben und dann die 4870 doch noch nicht fertig haben sollen - oder ist mit "not [...] anytime soon" nicht vor dem 25. gemeint?
Denn für die 4850 hätte es doch wohl keiner Verschiebung bedurft - also warum dann verschieben und doch nur einen Paper-Launch bei der 4870 haben?

w0mbat
2008-06-07, 00:34:24
@Kriton: Der Launch wurde nicht verschoben.

deekey777
2008-06-07, 00:35:04
RV770 Launch On 25th June, Clocks Finalized (http://www.vr-zone.com/articles/RV770_Launch_On_25th_June%2C_Clocks_Finalized/5857.html)

Also 625 und 750MHz.
Du bist langsam.
...und wie willst Du dann G80 beschreiben? 8 Vec16 oder 16 Vec8 ALUs? Klar gehen Vereinfachungen nicht in Einzelheiten ein, aber es ist eben nicht Vec16 vs. Vec16 zwischen den beiden Architekturen, weil man sonst automatisch den Unterschied in Effizienz uebersieht.

Welche Architektur der beiden lastet seine ALUs besser aus bei nicht handgemeisterten Ausnahme-Faellen?
Glaubst du nicht, dass du jetzt übertreibst?
Man kann oder muss sogar den G80 als 16*Vec8-ALUs beschreiben, aber auf der "Software-Ebene" mutieren diese zu 8 16-Way-SIMDs.
Was die Auslastung angeht: http://forum.beyond3d.com/showthread.php?p=1161396#post1161396 und insbesondere http://forum.beyond3d.com/showpost.php?p=1163691&postcount=912.

Da wundere ich mich gerade, warum mein Edit nicht möglich ist: Der pöse AnarchX hat sein Posting gelöscht... ;(

;D

tombman
2008-06-07, 00:35:06
...


http://www.techarp.com/showarticle.aspx?artno=550&pgno=0
Deswegen kam mir die 4870er Karte so nackt vor :)

Kriton
2008-06-07, 00:35:24
Sollten am 18. nicht beide vorgestellt werden?

Jedenfalls widerspricht das den Infos von VR-Zone.

w0mbat
2008-06-07, 00:36:26
Nein, der Launch is schon seit einer Weile auf den 25. festgelegt worden.

Ailuros
2008-06-07, 00:36:33
Es wundert mich ein wenig, dass sie den Launch-Termin nach hinten verschieben und dann die 4870 doch noch nicht fertig haben sollen - oder ist mit "not [...] anytime soon" nicht vor dem 25. gemeint?
Denn für die 4850 hätte es doch wohl keiner Verschiebung bedurft - also warum dann verschieben und doch nur einen Paper-Launch bei der 4870 haben?

GDDR5 availability.

AnarchX,

Mehr ALUs aber nicht mehr MADD+MADD.

deekey777
2008-06-07, 00:40:40
GDDR5 availability.

AnarchX,

Mehr ALUs aber nicht mehr MADD+MADD.

Die T-Einheit bleibt, oder?

Ailuros
2008-06-07, 00:41:10
Glaubst du nicht, dass du jetzt übertreibst?
Man kann oder muss sogar den G80 als 16*Vec8-ALUs beschreiben, aber auf der "Software-Ebene" mutieren diese zu 8 16-Way-SIMDs.
Was die Auslastung angeht: http://forum.beyond3d.com/showthread.php?p=1161396#post1161396 und insbesondere http://forum.beyond3d.com/showpost.php?p=1163691&postcount=912.


Uebertrieben wuerde ich aaronspinks' Beschreibung von 4 vs. 16 "Prozessoren" jeweils bezeichnen.

Was soll mir der Marketing-krampf AMD's gerade sagen? Packen wir es aber woanders an: very long instruction word oder superscalar letztendes? Und nein beides kann es nicht sein; was dazwischen liegt ist Marketing-Gewaesch.


***edit: "T" wie Tesselations-Einheit? Es war nie eine getrennte Einheit (PR-bullshit). Die ALUs sind einfach zu programmierbarer Tesselation faehig.

deekey777
2008-06-07, 00:44:37
T-Einheit ist die "Rys-Unit" (T wie transzedural).

AnarchX
2008-06-07, 10:43:13
Also doch 800 MADD SPs?!

http://img407.imageshack.us/img407/389/attachment4248b32ewz7.jpg (http://imageshack.us)
http://www.nordichardware.com/news,7841.html

Wenn man sich die Leistungsspekus für RV770 anschaut, dann treibt dieser nun definitiv die FLOPs-Vergleiche absurdum.
Mal sehen ob man wenigstens unter GPGPU mehr herausholen kann.

Aber da kommt sicherlich wieder ein Slide-War auf uns zu: "Why is the competitor not able to offer 1 TFLOPs on his $649 solution, while we can offer it for $229" oder so... X-D

Sorkalm
2008-06-07, 11:09:46
Hmm. Und was wurde neben den SPs noch verbreitert?
Wenn das alles in die gut 60 mm² Differenz zwischen RV670 und RV770 passt (geht man nach der Die-Size von Chiphell), müssen die SPs ja wirklich billig sein. :eek:

Odal
2008-06-07, 11:20:06
naja ich denke die TMUs wurden von 16 auf 24 oder gar 32 aufgebohrt..also eventuell verdoppelt...
und die speicherbandbreite wurde ja nahezu verdoppelt (mit GDDR5)....
dazu noch das AA was nicht mehr über die Shader ablaufen muß

klingt nach nem soliden konzept

GeneralHanno
2008-06-07, 11:29:33
hmmm folgende "konstellation" halte ich für denkbar:

der RV770 besteht aus 5 ALU-SIMD (vgl RV670 = 4), die jeweils als 16 ALUs enthalten (vgl RV670 = 16), aber jede ALu mit 10 "SP" (vgl RV670 = 5 "SP").

damit käme man auf marketing 800SP und die gerüchte von 5 clustern/kernen/SIMD lagen ja auch schon länger in der luft. zudem passt dies auch zur "ineffizienten-internen-verbreiterung" nach ailuros. zudem knackt man damit die 1TF ...

comments?

AnarchX
2008-06-07, 11:32:29
Das wären dann aber nur 4 TUs/16 TMUs oder vermutest du 8-TF-TUs, also insgesamt 32TA/TFs?

w0mbat
2008-06-07, 11:33:09
Hat ATI nicht immer gesagt das 16 ROPs/TMUs reichen?

Sorkalm
2008-06-07, 11:35:35
Das wären dann aber nur 4 TUs/16 TMUs oder vermutest du 8-TF-TUs, also insgesamt 32TA/TFs?

Wenn sie weiter mit 16 TMUs arbeiten (und an denen nichts verändert haben), dann würde mich das doch sehr wundern...

Zudem konnte man bisher von 32 TMUs lesen. Wenn man davon ausgeht, dass AMD diese Informationen verteilt hat (gehe ich von aus, denn dieser Mist von 480 SPs wurde ja wirklich von überall her erzählt - selbst jemand auf Folding@Home hat mitgemacht), ist auch anzunehmen, dass sie zumindest nicht drunter bleiben.

@w0mbat: Dave Orton hat beim Release des R420 mal gesagt, das 16 TMUs noch sehr lange reichen werden. Jetzt ist aber sogar die Taktfrequenz gesunken (auf 750 MHz beim Topprodukt), ich denke nicht, dass sie sogar die Texel-Füllrate senken.

Gast
2008-06-07, 11:38:12
ich wäre für 24 ROPs / 48 TMUs

GeneralHanno
2008-06-07, 11:45:04
ich wäre für 24 ROPs / 48 TMUs

ich wäre für 50ROPS und 100TMUS :rolleyes:
merkst du was? das ist doch absolut egal, denn das ganze muss ins transistorenbudget passen.

ich bin schon länger der meinung, dass AMD bei 4 "textur-clustern" bleiben wird, weil die teile einfach sch*** teuer sind und AMD lieber in ALU-power investiert (z.b. um physik/geometrie auf der GPU zu beschleunigen). wobei 4 "textur-cluster" ja noch nichts aussagen, ob es sich um quad- oder octo-TMUs handelt ;)

bei der z-fill darf man wohl auf eine verdopplung von 2 auf 4 hoffen, weil dies wesentlich günstiger/einfacher ist, als mehr tex-fill ...

Sorkalm
2008-06-07, 11:47:03
Octo-TMUs gingen auch noch, aber Gleichstand wäre da ja in der Hinsicht ein Rückschritt (geringere Taktraten) - glaube nicht, dass man sich das bei einem noch so engen Transistorbudget leistet.

horn 12
2008-06-07, 11:49:31
http://www.gigapc.it/prodotti/buildscheda.asp?codprod=vga739

Somit dürfte nun langsam die 200 Euro Grenze angeschritten werden und die 4870 wird somit sicher auch die 3870 X²-er Karte in ihre Schranken weisen,- und diese Teils um 10-15% wohl toppen werden, vor allem mit aktivem 4fach AA/16xAF wohl auch denklich mehr!
Nur verstehe ich AMD/ATI nicht so ganz was sie mit den ganzen X² er Karten der 3800 Serie noch erreichen wollen da noch extrem viele oft auf Lager sind.
Werden wohl in den nächsten 15-20 Tagen diese so schnell wie möglich loswerden wollen,- ob dies reicht?

deekey777
2008-06-07, 11:55:56
Octo-TMUs gingen auch noch, aber Gleichstand wäre da ja in der Hinsicht ein Rückschritt (geringere Taktraten) - glaube nicht, dass man sich das bei einem noch so engen Transistorbudget leistet.
Octo-TMUs gehen gerade nicht.
Was ginge, sind 2 "parallele" Quad-TMUs, die zwei Quads nebeneinander bearbeiten, die vom einen ALU-Quad stammen.
IMHO wäre es einfacher, die TUs zu entschlacken und nur die Einheiten zu behalten, die auch sinnvoll sind, dann aber von einem TMU-Block auf zwei unabhängige zu gehen.

Odal
2008-06-07, 11:57:52
http://www.gigapc.it/prodotti/buildscheda.asp?codprod=vga739

Somit dürfte nun langsam die 200 Euro Grenze angeschritten werden und die 4870 wird somit sicher auch die 3870 X²-er Karte in ihre Schranken weisen,- und diese Teils um 10-15% wohl toppen werden, vor allem mit aktivem 4fach AA/16xAF wohl auch denklich mehr!
Nur verstehe ich AMD/ATI nicht so ganz was sie mit den ganzen X² er Karten der 3800 Serie noch erreichen wollen da noch extrem viele oft auf Lager sind.
Werden wohl in den nächsten 15-20 Tagen diese so schnell wie möglich loswerden wollen,- ob dies reicht?

naja ich denk mal die verkauften sich nicht so dolle und müssen jetzt raus...der g92 wird jha auch verschleudert wenns schon 88GTs für 110€ gibt
http://geizhals.at/deutschland/a291564.html

ich wäre für 24 ROPs / 48 TMUs

der RV770 hat aber nen 256Bit SI das ist so sicher wie das Amen in der Kirche

GeneralHanno
2008-06-07, 12:10:13
ROPs und SI sind bei der R6xx architektur IMO vollkommen unabhängig (anders als bei nvidia!)

mehr ROPs sind sinnlos, da pix-fill irrelevant ist. um aber die z-fill zu steigern, gibt es bessere wege als mehr ROPs ;) qualität statt quantität ...

das hat ATi bei den TMUs allerdings falsch verstanden ;)

Nakai
2008-06-07, 12:32:26
damit käme man auf marketing 800SP und die gerüchte von 5 clustern/kernen/SIMD lagen ja auch schon länger in der luft. zudem passt dies auch zur "ineffizienten-internen-verbreiterung" nach ailuros. zudem knackt man damit die 1TF ...

comments?

Recht viel breiter macht man den Chip leider nicht. Dafür länger. Ob da Verbesserungen in die TMUs eingeflossen sind?
Ich hoffe auf 32 TFs.


mfg Nakai

Gast
2008-06-07, 13:38:50
. Jetzt ist aber sogar die Taktfrequenz gesunken (auf 750 MHz beim Topprodukt), ich denke nicht, dass sie sogar die Texel-Füllrate senken.


eben das ist das a und o ,die texelfüllrate ist sogar wichtiger als die 800 shader

w0mbat
2008-06-07, 13:55:07
@Ail: Bist du dir eigentlich 100%tig sicher mit den 800SP? Ich weiß zwar die Taktraten und die angebliche Rechenleistung, aber die könnte ja auch anders erreicht werden. Wie sicher bist du dir bei den 800SP?

Nakai
2008-06-07, 14:08:28
Hmm. Und was wurde neben den SPs noch verbreitert?
Wenn das alles in die gut 60 mm² Differenz zwischen RV670 und RV770 passt (geht man nach der Die-Size von Chiphell), müssen die SPs ja wirklich billig sein.

Die waren schon immer verdammt billig. Schau dir mal den Transistocount vom RV615, RV635 und den RV670 an.
Ich hab mal versucht die einzelnen Einheiten zu berechnen, leider ging das immer in die Hose.
Das teuerste ist wohl die Kontrolllogik und der Cache, was am meisten Transistoren kosten(im Vergleich) sollte.


mfg Nakai

Gast
2008-06-07, 14:08:28
Du hast den RV670 mit dem G92 verglichen. Also? :confused:

Macht doch wenig Sinn den schnellsten RV670 mit dem lahmsten G92 zu vergleichen, das Ganze mit RV770 gegenzurechnen, um am Ende den G92 schlecht darstehen zu haben.
das wollt ich auch nicht. ich sagte nur dass bei diesen taktraten etwa gleichstand herrscht und so die angepriesenen 70% verbreiterung/steigerung beim rv770 sicher nicht per die shrink vom g92b aufgeholt werden können. nunja, am ende hängts ja dann doch wieder an den taktraten und ich hab irgendwie so ne ahnung dass die 4000er extra n bisschen langsamer gemacht werden, aus welchem kaufargument auch immer.

GeneralHanno
2008-06-07, 14:15:19
eben das ist das a und o ,die texelfüllrate ist sogar wichtiger als die 800 shader

man macht es sich zu einfach, wenn man die schwäche des R6xx einfach NUR auf irgend eine fillrate zurückführt ;)

fassen wir mal etwas zusammen:

was wissen wir:
der RV770 hat 800SP und schafft je nach taktrate (625Mhz/750Mhz) über 1 TFLOPs und der output je "SP" bleibt konstant bei 2 (MUL+ADD)

für das R6xx design gilt folgende gleichung:
Streamprozessoren = Breite * Länge * 4 * ALU-Breite

die "breite" ist die anzahl der ALU-SIMD
die "länge" die anzahl der TU-blöcke
und dann eben die anzahl der sogenannte "superskalaren-stream-prozessoren" je ALU

eine steigerung von 320 SP auf 800SP entspicht einem faktor 2,5. ATi wird aber sicherlich nicht die breite auf 10 cluster oder die länge auf 10 TU-blöcke erhöhen.

daher muss ATi die anzahl der SP je ALU erhöhen (z.b. von Vec4+1 auf Vec8+1 o.ä.)

€dit:


@Ail: Bist du dir eigentlich 100%tig sicher mit den 800SP? Ich weiß zwar die Taktraten und die angebliche Rechenleistung, aber die könnte ja auch anders erreicht werden. Wie sicher bist du dir bei den 800SP?

nun, wenn es KEINE shaderdomain gibt und man auf 1TFLOP+ zu kommen, dann muss könnte man höchstens den FLOP-output je SP erhöhen (zur zeit ja 2, weil ADD + MUL). nun könnte man wie nvidia auf MADD+MUL gehen, was ich aber ausschließe, weil nvidia shadercode mul-lastiger ist als ATIs. denkbar wäre vll. 400SP a 2 MADD, die nach kreativer marketingzählweise zu 400SP*2=800SP werden :D

Nakai
2008-06-07, 15:06:36
daher muss ATi die anzahl der SP je ALU erhöhen (z.b. von Vec4+1 auf Vec8+1 o.ä.)

Das wäre sinnlos, da man selbst die alten Dinger kaum auslasten konnte.
Ich denke eher man hängt mehr SPs pro SIMD ran, damit die SIMDs noch größer werden.


mfg Nakai

GeneralHanno
2008-06-07, 15:12:33
dann MUSS ATi aber auch mehr Textur-cluster verbauen ;)
längere-SIMD = mehr TU ...

und wie ich schon sagte: 320 zu 800 ist ein Faktor von 2,5 !

Triskaine
2008-06-07, 15:14:30
Das wäre sinnlos, da man selbst die alten Dinger kaum auslasten konnte.
Ich denke eher man hängt mehr SPs pro SIMD ran, damit die SIMDs noch größer werden.


mfg Nakai

1. Ich halte das für ein unwahres, sich harnäckig haltendes Gerücht. Einer im B3d forum hat die Shaderauslastung getestet und kam bei den meisten Spielen auf eine durchschnittliche Ausnutzung von etwa 4 SPs.

2. Da stimme ich dir zu es sind wahrscheinlich einfach 10 cluster a 16 mal 5.

Triskaine
2008-06-07, 15:18:55
dann MUSS ATi aber auch mehr Textur-cluster verbauen ;)
längere-SIMD = mehr TU ...

und wie ich schon sagte: 320 zu 800 ist ein Faktor von 2,5 !

Das würde dann 40 TMUs bedeuten. Hmmm und das alles kommt auf 256 mm² zusammen? Klingt irgendwie unglaubwürdig. ARGH, warum kann nicht endlich launch Tag sein?

Nakai
2008-06-07, 15:42:57
dann MUSS ATi aber auch mehr Textur-cluster verbauen ;)
längere-SIMD = mehr TU ...

und wie ich schon sagte: 320 zu 800 ist ein Faktor von 2,5 !

Nein so meinte ich das nicht. Ich schrieb von größerer SIMD.

Der RV670 hatte 4 SIMDs, der RV635 hatte 3 SIMDs und der RV615 nur 2 SIMDs.
Ich gehe davon aus, dass die länge der SIMDs einen Großteil der Transistoren auffressen(vll für Kontrolllogik).
Der RV770 könnte dann DoppelSPs haben. Also statt MADD, Doppel-MADD.
Das erfordert kaum höhere Kontrolllogik.

Dann könnte man noch die TMUs mit 2 TFs aufbohren.


mfg Nakai

€:
Das würde dann 40 TMUs bedeuten. Hmmm und das alles kommt auf 256 mm² zusammen? Klingt irgendwie unglaubwürdig. ARGH, warum kann nicht endlich launch Tag sein?

Die RV670 TMUs sind schon sehr fett, ich denke man wird noch ein paar kleinere Dinger dranhängen.

Gast
2008-06-07, 16:03:49
Die RV670 TMUs sind schon sehr fett, ich denke man wird noch ein paar kleinere Dinger dranhängen.

Ja, die Texturleistung ist aber trotzdem zu niedrig um auf nVidia auf zu schließen.
Ich hoffe sie haben die Anzahl wenigstens verdoppelt, ansonsten kann ich mir den Performancesprung nicht erklären. Und das mit den 40 TMUs ist natürlich nur unter der Vorraussetzung das ATi das SP/TMU Verhältnis vom R600 beibehalten will.

Gast
2008-06-07, 16:19:18
Ja, die Texturleistung ist aber trotzdem zu niedrig um auf nVidia auf zu schließen.
Ich hoffe sie haben die Anzahl wenigstens verdoppelt, ansonsten kann ich mir den Performancesprung nicht erklären. Und das mit den 40 TMUs ist natürlich nur unter der Vorraussetzung das ATi das SP/TMU Verhältnis vom R600 beibehalten will.

ATI geht (u.a. auch durch Softwareoptimierungen) viel sparsamer mit der Füllrate um als die Konkurennz.

Gast
2008-06-07, 16:21:06
1. Ich halte das für ein unwahres, sich harnäckig haltendes Gerücht. Einer im B3d forum hat die Shaderauslastung getestet und kam bei den meisten Spielen auf eine durchschnittliche Ausnutzung von etwa 4 SPs.


das hat niemand im B3D-forum getestet, dort hat nur jemand eine ATI-folie gepostet, auf der in 5 spielen insgesamt eine durchschnittliche auslastung von ~4 zu sehen war.

Gast
2008-06-07, 16:22:10
ATI geht (u.a. auch durch Softwareoptimierungen) viel sparsamer mit der Füllrate um als die Konkurennz.


hoffentlich lassen sie diese optimierungen endlich weg, ansonsten wird die karte niemals eine konkurrenz zu nvidia werden, egal wie schnell sie ist.

Gast
2008-06-07, 16:24:12
hoffentlich lassen sie diese optimierungen endlich weg, ansonsten wird die karte niemals eine konkurrenz zu nvidia werden, egal wie schnell sie ist.

Ansichtssache. Ich zum Beispiel bin nicht so einer, dem gleich der ganze Spielspaß flöten geht, sobald eine Bodentextur in Ferne ein wenig flimmern mag.

GeneralHanno
2008-06-07, 17:02:26
trotzdem:
wenn ich zur zeit vor der wahl stehe mir eine 8800GT oder 3870 zu kaufen (kosten ja beide ähnlich viel) und die performence auch nicht soo unterschiedlich ist und ATi auch noch mit powerlplay winkt, so würde ich trotzdem zu nvidia greifen, weil hier die BQ größer ist ...

Gast
2008-06-07, 17:08:00
trotzdem:
wenn ich zur zeit vor der wahl stehe mir eine 8800GT oder 3870 zu kaufen (kosten ja beide ähnlich viel) und die performence auch nicht soo unterschiedlich ist und ATi auch noch mit powerlplay winkt, so würde ich trotzdem zu nvidia greifen, weil hier die BQ größer ist ...

Sind halt alles persönliche Meinungen. Ich würde dennoch zur ATI greifen, weil Kantenglättung für mich sehr viel wichtiger als ein etwas besseres AF ist und bei der HD3870 ein vernünftiger, von Spielen standarisierter 8xAA Modus mitkommt. Dazu noch der Dual Slot Kühler, DX10.1 (welches momentan noch keine große Rolle spielt und vielleicht auch nie spielen wird), meine Neigung den finanziell Schwächeren zu unterstützen und das meiner Meinung nach bessere Gesamtpaket ist komplett.

Gast
2008-06-07, 17:09:50
http://my.ocworkbench.com/bbs/showthread.php?p=432278#post432278

http://www.abload.de/img/hd4850-48702fc.jpg (http://www.abload.de/image.php?img=hd4850-48702fc.jpg)

Der_Korken
2008-06-07, 17:20:02
http://my.ocworkbench.com/bbs/showthread.php?p=432278#post432278

http://www.abload.de/img/hd4850-48702fc.jpg (http://www.abload.de/image.php?img=hd4850-48702fc.jpg)

Sieht mir nach nem CPU-Limit aus, denn eigentlich müsste die 4870 mindestens 20% schneller sein als die 4850. Der Chiptakt ist 20% höher und die Bandbreite 80% höher. Der 3Dmark06 ist nicht mehr sehr aussagekräftig, finde ich.

gamingforce
2008-06-07, 17:36:39
http://forums.vr-zone.com/showthread.php?t=285719

4870x2 WILL NOT have micro studdering.

Nakai
2008-06-07, 17:38:26
Und weiter unten postet w0mbat...lol;D

1050Mhz Shader Clock, ich bezweifle es, dass das Mickroruckelproblem gelöst werden kann.


mfg Nakai

Gast
2008-06-07, 17:38:46
Das wär ja der kracker.:D

Dan gleich zwei X2 kaufen und ab gehts.

Könnte mir sogar vorstellen das 2 X2 weniger Strom verbrauch als 2 GTX 280 in Sli...

Adam D.
2008-06-07, 17:45:23
Das wär ja der kracker.:D
Ja, das wäre richtig.

Könnte mir sogar vorstellen das 2 X2 weniger Strom verbrauch als 2 GTX 280 in Sli...
GTX280 = 236W TDP.
HD4870X2 = 2x ~150W --> ~300W (schätz ich mal)

GeneralHanno
2008-06-07, 17:46:51
es scheint wohl so, dass es sich um 160v5 einheiten handelt (RV670 = 64v5).
FALLS Ati tatsächlich einfach die R600-architektur nach oben skaliert hat (eben um R&D zu sparen ...), dann gibt es nur eine "sinnvolle" möglichkeiten um auf die besagten 800SP zu kommen: 8 mal 5

die frage ist nur 8 shader cluster und 5 textur cluster oder umgekehrt !

Gast
2008-06-07, 17:47:53
1050 MHz Shadertakt? Vielleicht sind die Angaben von Hardware-Infos doch nicht so verkehrt...

Odal
2008-06-07, 17:50:21
was hatten die für angaben?

Gast
2008-06-07, 17:51:37
GTX280 = 236W TDP.
HD4870X2 = 2x ~150W --> ~300W (schätz ich mal)

Deine Angaben sind leider falsch. Die richtigen Werte gibts erst, wenn AMD die Karten auf den Tisch legt.

Gast
2008-06-07, 17:52:48
ist ja alles etwas sehr komisch...

die Daten passen alle überhaupt nicht zusammen und das zwei Wochen vor dem start...

Gast
2008-06-07, 17:53:46
Hardware-Infos schrieb, dass die HD 4870 einen Shadertakt in Höhe von 1050 MHz hätte. Zur HD 4870 X2 lagen noch keine Infos vor.

Gast
2008-06-07, 17:54:51
http://forums.vr-zone.com/showthread.php?t=285719

4870x2 WILL NOT have micro studdering.
Aaaaha. Nur weil wegen 1800Mhz Speicher und 512Bit gibts keine Microruckler... Ganz, ganz fieses Marketing.

dildo4u
2008-06-07, 17:55:22
HD4870X2 = 2x ~150W --> ~300W (schätz ich mal)
Unsinn eine 4870 wird bei ca 130Watt(160TDP laut AMD) liegen eine X2 4870 bei ca 250Watt(Siehe Stromverbrauch 3870 vs X2 3870.) und ein Crossfire X aus 4 GPUs bei 500Watt.

Adam D.
2008-06-07, 17:55:24
Aaaaha. Nur weil wegen 1800Mhz Speicher und 512Bit gibts keine Microruckler... Ganz, ganz fieses Marketing.
While Radeon 3870X2 relys on the PLX chip to communicate between the GPUs, 4870X2 GPUs will comunicate with each other through the memory.
?

Unsinn eine 4870 wird bei ca 130Watt(160TDP laut AMD)liegen 2 X2 Karten sind dann bei vollem Takt bei ca 500Watt.Siehe Stromverbrauch 3870 vs X2 3870.
Ja, was ist daran jetzt so groß unterschiedlich zu meiner Aussage?

dildo4u
2008-06-07, 17:58:30
[i]

Ja, was ist daran jetzt so groß unterschiedlich zu meiner Aussage?
Der Gast sprach vom Stromverbrauch 280GTX SLI vs ein 4 CPU Crossfire X.

Gast
2008-06-07, 18:12:14
Der Gast sprach vom Stromverbrauch 280GTX SLI vs ein 4 CPU Crossfire X.

Du weisst doch garnicht wie es bei der 4800 aussieht was Stromverbrauch angeht.Du kannst da nichts draufrechnen...

Schlammsau
2008-06-07, 18:17:37
http://forums.vr-zone.com/showthread.php?t=285719

4870x2 WILL NOT have micro studdering.

Wenn das stimmt, hat nV wirklich nichts mehr zu lachen!:biggrin:

Gast
2008-06-07, 18:18:42
4870X2 = 2,4 TFlops!!! vs. GTX280 =933 GFlops

Bei zukünftigen Spielen, die stärker auf Shader-, Physik- und Raytracingberechnungen setzen wird die 4870X2 die GTX280 plattmachen.
Die niedrigere TMU-Leistung spielt dann keine Rolle mehr, d.h. die ATI-Karten sind zukunftssicherer als die von Nvidia.

tombman
2008-06-07, 18:19:02
http://forums.vr-zone.com/showthread.php?t=285719

4870x2 WILL NOT have micro studdering.
Glaube ich erst wenn ich es sehe :rolleyes:

Gast
2008-06-07, 18:19:41
http://my.ocworkbench.com/bbs/showthread.php?p=432278#post432278

http://www.abload.de/img/hd4850-48702fc.jpg (http://www.abload.de/image.php?img=hd4850-48702fc.jpg)

lol, da stimmen ja nichtmal die zahlen mit dem diagramm überein.

deekey777
2008-06-07, 18:21:43
Wenn das stimmt, hat nV wirklich nichts mehr zu lachen!:biggrin:
Klar, NV hat dann nichts zu lachen, wenn eine HD4870X2 nicht an Mikrorucklern leidet, aber am Mangel an CF-Profilen...

tombman
2008-06-07, 18:23:20
Klar, NV hat dann nichts zu lachen, wenn eine HD4870X2 nicht an Mikrorucklern leidet, aber am Mangel an CF-Profilen...
Das sowieso, weil das wird sich kaum ändern...

Außerdem reicht ja EINE X2 auch nicht wirklich aus, um Nvidia zu schlagen (2x GTX280 ist ja trotzdem wieder schneller), weil die zweite X2 ja trotzdem wieder über den Bus laufen muß-> und schon sind die MR wieder da :rolleyes:

Nur wenn sie es schaffen CF grundsätzlich von MR zu befreien wäre das ein echter Sieg.

Nene, erstmal abwarten...

Odal
2008-06-07, 18:27:08
wassn das für ne logik tombman? die 2xGTX280iger laufen also nicht über den pcie bus?

achnee das is ja von nvidia die machens eh immer richtig ^^

Gast
2008-06-07, 18:27:14
Das sowieso, weil das wird sich kaum ändern...

Außerdem reicht ja EINE X2 auch nicht wirklich aus, um Nvidia zu schlagen (2x GTX280 ist ja trotzdem wieder schneller), weil die zweite X2 ja trotzdem wieder über den Bus laufen muß-> und schon sind die MR wieder da :rolleyes:

Nur wenn sie es schaffen CF grundsätzlich von MR zu befreien wäre das ein echter Sieg.

Nene, erstmal abwarten...

Verschieden preisklassen....

dildo4u
2008-06-07, 18:28:43
Klar, NV hat dann nichts zu lachen, wenn eine HD4870X2 nicht an Mikrorucklern leidet, aber am Mangel an CF-Profilen...
Jup würden Seiten wie Computerbase das Testfeld der Games mal auf 20-30 auch weniger bekannte Titel erweitern,sehe der Gesammtdurchscnitt für alle X2 und GX2 Karten nicht mher so rosig aus.Davon ab sind idle und Lastverbauch unerträglich hoch und passen dann sogar nicht mher zum "grünen" Daumen Ruf der 3000 4000 Serie von AMD.

tombman
2008-06-07, 18:30:00
wassn das für ne logik tombman? die 2xGTX280iger laufen also nicht über den pcie bus?

achnee das is ja von nvidia die machens eh immer richtig ^^
?? Die machens genau so falsch, darum gehts ja. ATI BRAUCHT X2 um Nvidia zu schlagen, also BRAUCHEN die auch als erster eine grundsätzliche Strategie gegen MR...

Odal
2008-06-07, 18:33:06
?? Die machens genau so falsch, darum gehts ja. ATI BRAUCHT X2 um Nvidia zu schlagen, also BRAUCHEN die auch als erster eine grundsätzliche Strategie gegen MR...

ja hier gings ja um die speku das sie diese haben....da kamst du wieder ja dann haut man sich 2 GTX280 rein und schon müssen die sachen bei ATI über den Bus um mitzuhalten....

Gast
2008-06-07, 18:37:15
Nur wenn sie es schaffen CF grundsätzlich von MR zu befreien wäre das ein echter Sieg.

Glaub mir, sie werden es schaffen. Die 4800 Serie hat auch eine neue Crossfire-Technologie.

dildo4u
2008-06-07, 18:39:43
Glaub mir, sie werden es schaffen. Die 4800 Serie hat auch eine neue Crossfire-Technologie.
Crossfire X ist der größte Mist der jemals bei AMD /ATI durch die "Qualitätskontrolle" gekommen ist da müssten schon echte Wunder passieren.

Gast
2008-06-07, 18:39:48
Solangsam glaube ich aber wirklich das wir mit der 4800 Serie ne menge neuer sachen sehen werden.

Gast
2008-06-07, 18:41:51
4870X2 = 2,4 TFlops!!! vs. GTX280 =933 GFlops

Bei zukünftigen Spielen, die stärker auf Shader-, Physik- und Raytracingberechnungen setzen wird die 4870X2 die GTX280 plattmachen.
Die niedrigere TMU-Leistung spielt dann keine Rolle mehr, d.h. die ATI-Karten sind zukunftssicherer als die von Nvidia.

Bis sich Raytracing sich dursetzt ist die 4870X2 im Museum...

Ich glaube ATI hat eine fatale Fehlentwicklung gemacht und das teil kommt an schluss immer noch mit 16 TMUs....

tombman
2008-06-07, 18:42:28
ja hier gings ja um die speku das sie diese haben....da kamst du wieder ja dann haut man sich 2 GTX280 rein und schon müssen die sachen bei ATI über den Bus um mitzuhalten....
Die Speku war, daß eine X2 nicht über den Bus muß. ZWEI X2 müssen aber trotzdem wieder über den Bus, weils nun mal zwei Karten @ mobo sind, da gibts keine Abkürzungen entsprechend einer X2. Und ZWEI X2, also 4 Gpus, werden auch gebraucht um 2x GTX280 zu schlagen...

Gast
2008-06-07, 18:43:08
Ihr habt ATI wohl unterschätzt. ATI will 50% Marktanteil erreichen, und sie meinen es ernst, das werdet Ihr bald feststellen.

Gast
2008-06-07, 18:43:34
Crossfire X ist der größte Mist der jemals bei AMD /ATI durch die "Qualitätskontrolle" gekommen ist da müssten schon echte Wunder passieren.


du hast wirklich zu wenig ahnung von der marterie,bleib lieber bei den konsolen.

tombman
2008-06-07, 18:43:45
Glaub mir, sie werden es schaffen. Die 4800 Serie hat auch eine neue Crossfire-Technologie.
Und ich soll dir GAST glauben weil du in echt der CEO von AMD bist, oder wie oder was?

Gast
2008-06-07, 18:46:29
This is certainly a slap in NVIDIA's face. AMD's mainstream chip can do more FLOPS than NVIDIA enthusiast chips, and AMD's coming high-end chips will pack twice the FLOPS...

w0mbat
2008-06-07, 18:49:26
Toll, der Gast kann NHW quoten.

Odal
2008-06-07, 18:50:43
Die Speku war, daß eine X2 nicht über den Bus muß. ZWEI X2 müssen aber trotzdem wieder über den Bus, weils nun mal zwei Karten @ mobo sind, da gibts keine Abkürzungen entsprechend einer X2. Und ZWEI X2, also 4 Gpus, werden auch gebraucht um 2x GTX280 zu schlagen...

ja und wo sind jetzt die 2xGTX280 im vorteil?

Gast
2008-06-07, 18:51:38
@tombman:

Also,nehmen wir mal an, die x2 leidet nicht an dem Mikrorucklerprob. und schlägt die GTX280. Warum ist ATI in der Pflicht 2 ihrer Karten, also 4 GPU´s, ebenfalls ohne Mikrogeruckel zu verbinden, wenn es Nvidia nicht mit 2 GPU´s schafft.

Sorry, falls ich das falsch verstanden hab...aber diese Logik erschließt sich mir nicht !

@Ich denke ATI wird einfach ihr Design etwas aufblähen, wie Ail gesagt hat und sonst nichts bahnbrechendes zustande bringen. Alles andere wäre eine super Überraschung, allerdings unwahrscheinlich.

dildo4u
2008-06-07, 18:51:48
ja und wo sind jetzt die 2xGTX280 im vorteil?
Stromverbrauch wäre z.B ein Punkt.

Gast
2008-06-07, 18:57:21
omg wenn das wieder lese,2x 4870x2 gegen eine 280gtx sli,da ist doch die ati mit sicherem 50% performance zuwachs total überlegen,vielleicht pack das ein triple aber sli ist keine konkurenz für ati.

Gast
2008-06-07, 19:32:55
omg wenn das wieder lese,2x 4870x2 gegen eine 280gtx sli,da ist doch die ati mit sicherem 50% performance zuwachs total überlegen,vielleicht pack das ein triple aber sli ist keine konkurenz für ati.
Schonmall die Preise vergleichen?

Gast
2008-06-07, 19:34:51
klar 900 euro ati

1800 euro triple nv

sonst noch für rechenaufgaben?

Gast
2008-06-07, 19:46:59
klar 900 euro ati

1800 euro triple nv

sonst noch für rechenaufgaben?

Da haben wir es ja.

Also warum lassen wir dann nicht gleich drei X2 gegen 3 280GTX antreteten.Dann wär das schon gerechter....

Eggcake
2008-06-07, 19:55:58
? Er sagte ja dass 2x280GTX keine Konkurrenz für 2x4870X2 wären...

Gast
2008-06-07, 19:57:23
Da haben wir es ja.

Also warum lassen wir dann nicht gleich drei X2 gegen 3 280GTX antreteten.Dann wär das schon gerechter....


rofl weil eine x2 mit großer sicherheit 25% schneller ist als eine gtx.

w0mbat
2008-06-07, 19:57:44
OMFG! Hört doch mal auf mit dem Scheiß was jetzt gegen wen gestellt werden muss und überlegt euch lieber wie der RV770 jetzt wirklich aussieht.

Gast
2008-06-07, 19:59:57
könnte jemand dann die neuen spekus zusammenfassen?

800sp
entweder 8x5 oder 5x8
4z pro clock?
wie wär das mit den TMU/TFs?

Unyu
2008-06-07, 20:03:54
Also warum lassen wir dann nicht gleich drei X2 gegen 3 280GTX antreteten.
Seit wann laufen 3 X2 Karten (6GPUs) im CF?

w0mbat
2008-06-07, 20:08:36
Seit CFX?

=Floi=
2008-06-07, 20:11:12
4 chips skalieren aber nicht so gut wie 2 und somit dürfte das 280er sli sich hier wieder absetzen

tombman
2008-06-07, 20:16:17
@tombman:

Also,nehmen wir mal an, die x2 leidet nicht an dem Mikrorucklerprob. und schlägt die GTX280. Warum ist ATI in der Pflicht 2 ihrer Karten, also 4 GPU´s, ebenfalls ohne Mikrogeruckel zu verbinden, wenn es Nvidia nicht mit 2 GPU´s schafft.

Weil Nvidia mit 2x GTX280 soviel fps produzieren wird, daß man längst aus dem MR Bereich HERAUSSEN sein wird- im Vergleich zu einer X2 :cool:

Beispiel:

GTX280: 30fps -> kein MR (is ja klar, da single card)
R700 : 36fps -> kein MR (ANNAHMEN: R700 20% schneller+ Wunder @ X2 MR)
2x GTX280: 55fps -> MR nicht mehr spürbar --> OWNED ;)

Und mit 4 Gpus hätte ATI:

1.) normales CF mit 4 Gpus -> welcome to MR hell :)
2.) Skalierung anyone? Da könnten 2x GTX280 sogar 2x R700 schlagen!

Gast
2008-06-07, 20:18:49
Weil Nvidia mit 2x GTX280 soviel fps produzieren wird, daß man längst aus dem MR Bereich HERAUSSEN sein wird- im Vergleich zu einer X2 :cool:

Beispiel:

GTX280: 30fps -> kein MR (is ja klar, da single card)
R700 : 36fps -> kein MR (ANNAHMEN: R700 20% schneller+ Wunder @ X2 MR)
2x GTX280: 55fps -> MR nicht mehr spürbar --> OWNED ;)


2 r700 65fps mega ownt MR nothing was das`?

tombman
2008-06-07, 20:21:13
2 r700 65fps mega ownt MR nothing was das`?
2x R700 wäre aber wieder CF MR.

Das MR Wunder würde ja nur bei EINER X2 gehen. Bei 4 Gpus nicht mehr...

..falls die Gerüchte über X2 MR Wunder überhaupt stimmen...

Sind ja bis jetzt auch nur feuchte Träume von irgendwelchen Forenheinis ;)

GeneralHanno
2008-06-07, 20:21:20
OMFG! Hört doch mal auf mit dem Scheiß was jetzt gegen wen gestellt werden muss und überlegt euch lieber wie der RV770 jetzt wirklich aussieht.

hab ich doch schon ;)
du brauchst nurnoch deinen senf dazu geben ...

entweder 8 ALU-SIMD mit 5 Tex-Clustern (sprich 20TMUs)
oder 5 ALU-SIMD mit 8 Tex-Clustern (ergo 32 TMUs)

dazu 16ROPs mit 4z ...

Gast
2008-06-07, 20:25:10
hab ich doch schon ;)
du brauchst nurnoch deinen senf dazu geben ...

entweder 8 ALU-SIMD mit 5 Tex-Clustern (sprich 20TMUs)
oder 5 ALU-SIMD mit 8 Tex-Clustern (ergo 32 TMUs)

dazu 16ROPs mit 4z ...
ist die karte damit schneller als eine 9800 GTX?

Gast
2008-06-07, 20:25:40
2x R700 wäre aber wieder CF MR.

Das MR Wunder würde ja nur bei EINER X2 gehen. Bei 4 Gpus nicht mehr...

..falls die Gerüchte über X2 MR Wunder überhaupt stimmen...

Sind ja bis jetzt auch nur feuchte Träume von irgendwelchen Forenheinis ;)


es ist nicht spürbar bei 65 fps verstehst du kein freund:)

Unyu
2008-06-07, 20:27:11
Seit CFX?
Bilder/Link?
Von 2x 3870 X2 gibts massig Bilder, von 3x überhaupt nicht.

tombman
2008-06-07, 20:28:14
es ist nicht spürbar bei 65 fps verstehst du kein freund:)
Bei 4 Gpus kann MR bei 65fps SEHR WOHL spürbar sein ;)

Adam D.
2008-06-07, 20:29:27
ist die karte damit schneller als eine 9800 GTX?
Das ist wohl inzwischen gesichert.

Gast
2008-06-07, 20:30:34
Bei 4 Gpus kann MR bei 65fps SEHR WOHL spürbar sein ;)

Der Bereich >45fps gilt nur für ZWEI Gpus ;) Je mehr Gpus du nimmst, DESTO SCHLIMMER wird es -> klingt paradox, ist aber so (selbst getestet bei Triple SLI-> deswegen ging die dritte Karte auch schnell wieder zurück)


tja wenn du eins und eins zusammen zählst sind 2 r700 karten eigentlich 2 karten:)

J0ph33
2008-06-07, 20:30:38
GTX280: 30fps -> kein MR (is ja klar, da single card)
R700 : 36fps -> kein MR (ANNAHMEN: R700 20% schneller+ Wunder @ X2 MR)
2x GTX280: 55fps -> MR nicht mehr spürbar --> OWNED ;)

2x R700: 66fps -> MR nicht mehr spürbar --> PWNED ;)

oder was? das einzig dämliche wäre wohl der inputlag, aber ich glaub eh nicht daran, dass die MR gelöst sind...
btw, warum sollte nV AFR besser als ATi AFR skalieren?


Der Bereich >45fps gilt nur für ZWEI Gpus ;) Je mehr Gpus du nimmst, DESTO SCHLIMMER wird es -> klingt paradox, ist aber so (selbst getestet bei Triple SLI-> deswegen ging die dritte Karte auch schnell wieder zurück)

wenn die sache mit der MR-Lösung stimmt beim R700, würde das aber nicht gelten, sondern es müsste die MR-Verteilung von 2 GPUs auftreten
wobei hier die frage ist, wie ATi die MR gelöst haben will

tombman
2008-06-07, 20:33:20
tja wenn du eins und eins zusammen zählst sind 2 r700 karten eigentlich 2 karten:)
Nein, eben nicht. Weil es nur EINEN Modus geben kann. Entweder der X2 Wundermodus, oder normales CF- ne Mischung gibts nicht. Oder es wäre Wunder 2.0 :)

Aber das ganze Gerede ist sowieso 100% Bullshit, weil alles auf einem X2-Wundermodus beruht, den NIEMAND von Wichtigkeit bestätigt hat.

Adam D.
2008-06-07, 20:35:33
Nein, eben nicht. Weil es nur EINEN Modus geben kann. Entweder der X2 Wundermodus, oder normales CF- ne Mischung gibts nicht. Oder es wäre Wunder 2.0 :)

Aber das ganze Gerede ist sowieso 100% Bullshit, weil alles auf einem X2 Wundermodus beruht, den NIEMAND von Wichtigkeit bestätigt hat.
Jop, momentan ist das von einer Quelle berichtet worden und so lang es da nicht zumindest mal 'ne weitere Bestätigung gibt, wär ich vorsichtig. Obwohl es natürlich klasse wär, weil ATi damit guten Anschluss ans High-End finden würd. Davon profitieren wir alle.

GeneralHanno
2008-06-07, 20:38:08
Oder um das ganze etwas Anschaulicher zu machen ;)

Legende:
[ALU] = 4 x Vec4+1 = 20 Streamprozessoren
[TU] = 4TMUs + 8TFUs


RV615

- 40 SP
- 4 TMUs

SIMD1 SIMD2
[ALU] [ALU] <- [TU1]


RV635

- 120 SP
- 8 TMUs

SIMD1 SIMD2 SIMD3
[ALU] [ALU] [ALU] <- [TU1]
[ALU] [ALU] [ALU] <- [TU2]


R600/RV670

- 320 SP
- 16 TMUs

SIMD1 SIMD2 SIMD3 SIMD4
[ALU] [ALU] [ALU] [ALU] <- [TU1]
[ALU] [ALU] [ALU] [ALU] <- [TU2]
[ALU] [ALU] [ALU] [ALU] <- [TU3]
[ALU] [ALU] [ALU] [ALU] <- [TU4]


RV770-Variante1

- 800SP
- 32 TMUs

SIMD1 SIMD2 SIMD3 SIMD4 SIMD5
[ALU] [ALU] [ALU] [ALU] [ALU] <- [TU1]
[ALU] [ALU] [ALU] [ALU] [ALU] <- [TU2]
[ALU] [ALU] [ALU] [ALU] [ALU] <- [TU3]
[ALU] [ALU] [ALU] [ALU] [ALU] <- [TU4]
[ALU] [ALU] [ALU] [ALU] [ALU] <- [TU5]
[ALU] [ALU] [ALU] [ALU] [ALU] <- [TU6]
[ALU] [ALU] [ALU] [ALU] [ALU] <- [TU7]
[ALU] [ALU] [ALU] [ALU] [ALU] <- [TU8]


RV770-Variante2

- 800SP
- 20 TMUs

SIMD1 SIMD2 SIMD3 SIMD4 SIMD5 SIMD6 SIMD7 SIMD8
[ALU] [ALU] [ALU] [ALU] [ALU] [ALU] [ALU] [ALU] <- [TU1]
[ALU] [ALU] [ALU] [ALU] [ALU] [ALU] [ALU] [ALU] <- [TU2]
[ALU] [ALU] [ALU] [ALU] [ALU] [ALU] [ALU] [ALU] <- [TU3]
[ALU] [ALU] [ALU] [ALU] [ALU] [ALU] [ALU] [ALU] <- [TU4]
[ALU] [ALU] [ALU] [ALU] [ALU] [ALU] [ALU] [ALU] <- [TU5]

Gast
2008-06-07, 20:40:38
..falls die Gerüchte über X2 MR Wunder überhaupt stimmen...



das wäre nicht wirklich ein wunder, auch bei SLI nicht, kostet aber sicher performance, wodurch wieder fraglich wird ob die X2 überhaupt mit der 280GTX mithalten kann.

Gast
2008-06-07, 20:41:40
ist die karte damit schneller als eine 9800 GTX?

wenn nicht wäre es extrem peinlich.

Gast
2008-06-07, 20:43:17
Bei 4 Gpus kann MR bei 65fps SEHR WOHL spürbar sein ;)

die MR werden weniger offensichtlich je mehr GPUs rendern.

bei 2 GPUs hast du alle 2 frames einen großen unterschied, bei 4GPUs nur mehr alle 4.

HarryHirsch
2008-06-07, 20:44:46
ich glaub ja der rv770 wird von einigen hier extrem überschätzt

Adam D.
2008-06-07, 20:45:04
das wäre nicht wirklich ein wunder, auch bei SLI nicht, kostet aber sicher performance, wodurch wieder fraglich wird ob die X2 überhaupt mit der 280GTX mithalten kann.
Angenommen, eine GTX280 schafft in gängigen Settings 2x9800GTX und eine HD4870 ist etwa 30% schneller eine 9800GTX, dann wär das durchaus machbar. Dazu muss man aber sagen, dass die Treiber endlich mal mit offenen und konfigurierbaren Profilen ausgestattet werden müssen und das AFR-Problem ist tatsächlich beseitigt worden (was ich nicht so ganz glauben mag).

tombman
2008-06-07, 20:50:02
die MR werden weniger offensichtlich je mehr GPUs rendern.

bei 2 GPUs hast du alle 2 frames einen großen unterschied, bei 4GPUs nur mehr alle 4.
Nö, ist gerade anders herum ;) Klar hast du bei 4 gpus nur mehr alle 4 frames einen Unterschied, dafür einen GEWALTIGEN MIT VIEL MEHR MS!
Es kommt nicht so drauf an wie oft du den pösen MS siehst, sondern wie hoch er ist. Die drei schnellen frames vorher siehst du eh nicht, das Auge+Hirn flippt NUR bei dem MEGA-MS aus ;D

Wie gesagt, ich hatte mit SLI: 10-50-10-50 und mit Triple SLI: 10-10-70-10-10-70. Der 70er kommt quantitativ auch viel seltener als der 50er bei SLI vor, aber wenn es kommt FICKT er dein Auge+Hirn. Beides sind 30fps, aber die 10-10-70er Variante ruckelte MEHR als die 10-50-10-50. DH, je MEHR Gpus du nimmst, desto SCHLIMMER wird es.

gamingforce
2008-06-07, 21:35:54
ich glaub ja der rv770 wird von einigen hier extrem überschätzt

wenn ich das alle so lese wird er unterschätzt ;)

2x4870 1GB werden mit Sicherheit schneller als 1 GTX280.

Gast
2008-06-07, 21:38:22
Ja Ati verhält sich zurzeit extrem bedeckt wie Nvidia damals zur G80 Zeiten.

Die 4800 wird ein Killer werden...

Gast
2008-06-07, 21:44:33
Angenommen, eine GTX280 schafft in gängigen Settings 2x9800GTX und eine HD4870 ist etwa 30% schneller eine 9800GTX, dann wär das durchaus machbar. Dazu muss man aber sagen, dass die Treiber endlich mal mit offenen und konfigurierbaren Profilen ausgestattet werden müssen und das AFR-Problem ist tatsächlich beseitigt worden (was ich nicht so ganz glauben mag).


da gibt es aber noch diverse unterschiede.
eine 4870xt wird in niedrigen auflösungen schon bis zu 30% schneller sein,in hohen auflösungen mit aa unf af kann sich das schnell auf 60-80% erhöhen.

Gast
2008-06-07, 21:47:52
da gibt es aber noch diverse unterschiede.
eine 4870xt wird in niedrigen auflösungen schon bis zu 30% schneller sein,in hohen auflösungen mit aa unf af kann sich das schnell auf 60-80% erhöhen.


richtig so wird es kommen

gamingforce
2008-06-07, 22:00:25
Ja Ati verhält sich zurzeit extrem bedeckt wie Nvidia damals zur G80 Zeiten.

Die 4800 wird ein Killer werden...

ein Killer vieleicht nicht grad, aber die P/L Karte schlechhin.

tombman
2008-06-07, 22:01:30
Die 4800 wird ein Killer werden...
Ohne X2 wird die gar nix werden, das sagt schon der Preis, und der ist auch keine Speku mehr ;)

Gast
2008-06-07, 22:13:44
Die 4800 wird ein Killer werden...


wenn ATI ihre karte nicht endlich ordentlich filtern lässt ist sie schlichtweg uninteressant, egal wie schnell sie ist oder wie wenig sie kostet.

Gast
2008-06-07, 22:33:46
wenn ATI ihre karte nicht endlich ordentlich filtern lässt ist sie schlichtweg uninteressant, egal wie schnell sie ist oder wie wenig sie kostet.

Verstanden Doktor Lupe.;D

Gast
2008-06-07, 23:48:14
Ohne X2 wird die gar nix werden, das sagt schon der Preis, und der ist auch keine Speku mehr ;)

Der Preis sagt mir eher, dass ATI von NVIDIA ordentlich Marktanteile abnehmen will. Wenn die ATI-Karten 100$ günstiger sind bei gleicher Leistung hat Nvidia ein ziemliches Problem.

Gast
2008-06-08, 00:02:57
wenn ich das alle so lese wird er unterschätzt ;)

2x4870 1GB werden mit Sicherheit schneller als 1 GTX280.

Ratemal was 2x1GB GDDR5 kosten... mit nur GDDR3 fehlt der Karte doch die Bandbreite für die Arbeitsauflösung.
Warum hat G200 den billigeren GDDR3 wohl bekommen.

Gast
2008-06-08, 00:13:44
wenn ATI ihre karte nicht endlich ordentlich filtern lässt ist sie schlichtweg uninteressant, egal wie schnell sie ist oder wie wenig sie kostet.

hach schön wie die Argumente immer mehr ausgehen. Erst hieß es der Rv770 wird ein witz, dann heißt wäre ja peinlich wenn keine 9800er weggeputzt wird und nun wird sich schon drauf berufen dass die ja so schnell sein können wie sie wollen weil sie ja sooooo schlecht filtern. Erinnert mich irgendwie an den NV30/35...

Odal
2008-06-08, 01:31:29
Ratemal was 2x1GB GDDR5 kosten... mit nur GDDR3 fehlt der Karte doch die Bandbreite für die Arbeitsauflösung.
Warum hat G200 den billigeren GDDR3 wohl bekommen.


weil er dafür nen teures speicherinterface und pcb bekommt?

tombman
2008-06-08, 01:37:51
Warum hat G200 den billigeren GDDR3 wohl bekommen.
Weil Nvidia bei HighEnd gerne auf Nummer sicher geht. Deshalb auch 65nm und GDDR3. Da wußten sie, das kriegen sie hin.

w0mbat
2008-06-08, 05:11:45
Ich würde jetzt einfach mal in den Raum werfen dass der RV770 vielleicht ein >300mm² Die hat. Die 256mm² gehen nämlich nur von den GPU-Z Infos aus.

Ailuros
2008-06-08, 07:53:24
wenn ich das alle so lese wird er unterschätzt ;)

2x4870 1GB werden mit Sicherheit schneller als 1 GTX280.

Mit wieviel "Sicherheit" im Durchschnitt? Es wurde bis jetzt nur ein Ergebnis nach aussen geleakt und dieses wurde von CF 2*RV770 eingeschaetzt. AMD hat weder eine GTX280 noch die finalen Launchtreiber momentan in der Hand.

w0mbat,

Das dumme ist eben dass um die 250 Quadratmillimeter absolut ideal waeren fuer die Margen was X2 Gespanne betrifft. Lass mal der Sache etwas Zeit bis mehr heraussickert.

GeneralHanno,

Entweder verpass ich irgendwas oder 8*5=40.

GeneralHanno
2008-06-08, 08:39:08
GeneralHanno,

Entweder verpass ich irgendwas oder 8*5=40.

8x5=40
40x20=800 ;)

nun schau dir mal das R600 schaltbild an, und überlege woher die 20 kommen ...

ich sag nur zum R600:
4x4=16
16x20 = 320

Cpl. Dwayne Hicks
2008-06-08, 08:46:52
8 x 5 x (4 x 5) = 800 :smile:

jeder der 5 Cluster in jedem SIMD hat 4 x vec5 da hat sich also gegenueber dem R600 nichts geaendert. ;)

Odal
2008-06-08, 08:52:38
20 TMUs wären aber etwas enttäuschend

AnarchX
2008-06-08, 08:58:04
Die 8 bezieht sich auf die Tiefe der SIMDs und somit auch der TU-SIMD: 8*4TFs=32TMUs.

8 parallele ALU-SIMDs wäre wohl bei den ~250mm² kaum machbar. ;)

Cpl. Dwayne Hicks
2008-06-08, 09:01:32
Dann haette sich das TMU zu SP Verhaeltniss gegenueber R(V)6xx nochmals halbiert... :rolleyes: Wuerde mich nicht wundern, die leute bei ATi sind scheinbar Arithmetik Fetischisten.

EDIT: ich les grade AnarchX's post. lol ich dachte wir reden ueber die Version mit 8 parallelen SIMDs, scheinbar nicht... :D Sind die TMUs dann wirklich guenstiger als ein breiteres SIMD design?

Schlammsau
2008-06-08, 09:22:24
Was soll das dumme gerede von nicht vorhandenen CF Profilen?
Ihr habt doch keine Ahnung! Alle mehr oder weniger bekannten Games werden unterstützt!
Und die die nicht unterstützt werden, brauchen die Leistung doch eh nicht!
Ich weiss nicht was ihr habt? Oder braucht ihr umbedingt 500fps bei einem 5Jahre alten Noname Game!?
Assassins Creed mit dem bei der Veröffentlichung aktuellem Treiber, hatte CF besser als SLi skaliert!
Devil May Cry das gleiche! 10% schneller durch SLi! 90% schneller mit CF!

Gast
2008-06-08, 09:33:14
Musst du immer ausfallend werden?
Wo steht eigentlich was von CF Profilen? Es hies hier in den letzten 2 Seiten nur, das die geleakten Benches wohl eher CF 2xRV770 sind und keine R700 Karte.
BTW wenn CF 80% schneller ist in einem Spiel als SLI, dann funktioniert SLI da nicht bzw. das Profil bringt nix und die Benchmark Latte fehlt als Beweis auch ^^

Unyu
2008-06-08, 11:06:00
Warum muss man CF mit SLi vergleichen? :rolleyes:

1x RV770 vs 1x G92b
oder
2x RV770 vs 1x G200
oder
4x RV770 vs 2x G200
oder
? vs 3x G200

GeneralHanno
2008-06-08, 11:12:42
Die 8 bezieht sich auf die Tiefe der SIMDs und somit auch der TU-SIMD: 8*4TFs=32TMUs.

8 parallele ALU-SIMDs wäre wohl bei den ~250mm² kaum machbar. ;)

das ist die große frage ;)

was ist "billiger"?

8 parallele ALU-SIMD mit 20 TMUs oder
5 parallele ALU-SIMD mit 32 TMUs ...

Aquaschaf
2008-06-08, 11:48:09
Ich wage zu behaupten dass 20 TMUs auf keinen Fall genug wären damit die 4850 in die Nähe der 9800 GTX kommen könnte.

Unyu
2008-06-08, 11:51:33
Es gibt doch Filteroptimierungen.

Aquaschaf
2008-06-08, 11:56:58
Es gibt doch Filteroptimierungen.

Die gibt es doch jetzt schon. Selbst wenn es bei den selben Optimierungen wie jetzt bleibt, dann hat eine 4850 in dem Szenario immer noch lediglich 10% mehr Texturfilterleistung als eine 3870.

Cpl. Dwayne Hicks
2008-06-08, 13:10:21
Wie waers mit 5 TUs aber dann halt mehr Textur filter pro Tex Unit? Das wuerde beim AF doch schon was reissen...

AnarchX
2008-06-08, 13:18:20
Wäre vielleicht auch eine Möglichkeit:

Also 5 TUs mit je 8 TFs, was dann 4 SIMDs mit je 5x 8x* Vec4+Scalar-ALUs nach sich zieht.

*Was bei R6xx noch 4er-Blöcke sind.

edit: Text korrigiert und mal auf die schnelle visualisiert:

http://img291.imageshack.us/img291/9025/rv770800spuv9.png

Dürfte eigentlich gar nicht mal so teuer sein.

Triskaine
2008-06-08, 13:45:48
Mit 800 SPs und 40 TMUs kommt man aber nie und immer auf nur ~250 mm² Die Fläche. Ausser AMD kann auf einmal zaubern, oder die TMUs verbrauchen weniger Platz als gedacht, denn die ALUs sind laut AMD nicht besonders groß.

Cpl. Dwayne Hicks
2008-06-08, 14:10:43
Wäre vielleicht auch eine Möglichkeit:

Also 5 TUs mit je 8 TFs, was dann 4 SIMDs mit je 5x 8x* Vec4+Scalar-ALUs nach sich zieht.

*Was bei R6xx noch 4er-Blöcke sind.

edit: Text korrigiert und mal auf die schnelle visualisiert:

http://img291.imageshack.us/img291/9025/rv770800spuv9.png

Dürfte eigentlich gar nicht mal so teuer sein.

Danke fuer die Visualisierung! Ich finde sowas machts einem immer einfacher.

Gast
2008-06-08, 14:20:05
was ist "billiger"?

8 parallele ALU-SIMD mit 20 TMUs oder
5 parallele ALU-SIMD mit 32 TMUs ...

sicherlich ersteres.

4 Vitamins
2008-06-08, 14:27:09
kam das schon:

http://forums.vr-zone.com/showthread.php?t=285719

Got some inside info from a source who doesn't wish to be named.

HD 4870 X2 has 1024MB GDDR5, 2x 256bit memory interface, 1050MHz shader clock, 1800MHz memory clock. Core clock is defined by the AIB partners and ASUS will have the highest clocks.

While Radeon 3870X2 relys on the PLX chip to communicate between the GPUs, 4870X2 GPUs will comunicate with each other through the memory. Since the GDDR5 is clocked at 1800, the total bandwidth will be roughly 160 GB/s at 1 Gigabyte through the 256bit-bus, compaired to the 8 GB/s of the PLX chip of the HD3870x2. Also 4870x2 WILL NOT have micro studdering.

gruss

Chris2CB
2008-06-08, 14:30:33
Ein stark abweichender Shader Takt ist aber bei RV770 nicht vorhanden.

Gast
2008-06-08, 14:52:25
While Radeon 3870X2 relys on the PLX chip to communicate between the GPUs, 4870X2 GPUs will comunicate with each other through the memory.

wie soll das gehen, wenn jede GPU ihren eigenen speicher bekommt?

vor allem ist es auch ein toller "fortschritt" anstatt einer dezidierten verbindung die speicherzugriffe zu blockieren.

Gast
2008-06-08, 15:01:03
So wie es aussieht wird der R700 mit Shared Memory arbeiten.
Allerdings bin ich sehr skeptisch, das Ati die Mikrorucklerproblematik komplett in den Griff bekommt.

Gast
2008-06-08, 15:01:21
Zu viele Fehler in diesem "Leak", denke da ist jemand AMD auf den Leim gegangen und hat Fehlinformationen geleaket, nun weis AMD wer es war und wird ein neues Member in der NDA Hell willkommen heisen ;)

RoNsOn Xs
2008-06-08, 15:08:42
soweit ich weiß hat micro stuttering doch nichts mit den microrucklern zu tun.
afaik war das was anderes. :confused:

Gast
2008-06-08, 15:17:50
Was ist denn der Unterschied zwischen Stuttering und Ruckeln?
Afaik kommt Stuttering beim Nachladen von Texturen sehr häufig vor, da hat man 40-60FPS (geht auch höher) und das Bild hunzt vor sich hin. Während das Ruckeln bei eigentlich flüssigem Bild (30-40fps) zum Vorschein tritt, weil die Bilder in unterschiedlichen Abständen ankommen, Bewegungen werden Ruckartig oder bleiben kurz stehen.

Gast
2008-06-08, 15:20:27
soweit ich weiß hat micro stuttering doch nichts mit den microrucklern zu tun.
afaik war das was anderes. :confused:

Das ist ein und dasselbe.

AnarchX
2008-06-08, 15:51:10
Danke fuer die Visualisierung! Ich finde sowas machts einem immer einfacher.

Vorallem macht es wohl durchaus Sinn, bei R6xx sind es ja Quad-TMUs, weshalb die ALUs auch in Quads angeordnet sind.

Wenn man aber erstere nun auf Octa-TMUs aufbohrt, so müsste man ja auch die ALUs in Oktetts anordnen.

Siehe B3D-Artikel:
http://img74.imageshack.us/img74/9225/clustersampler4882cad4cq4.jpg
http://www.beyond3d.com/content/reviews/16/8

Und im Endeffekt ergibt es ein stimmiges Gesamtbild:
- weiterhin nur 4 ALU-SIMDs, was Transistoren spart
- 40 TMUs über 5 aufgebohrte TUs, was Transistoren spart
- Tex:ALU-Verhältnis "verschlechtert" sich nicht gegenüber R600/RV670
- passt zu den 160x5 von Chiphell, die sich offenbar auf den horizontalen Aufbau bezogen

deekey777
2008-06-08, 16:08:36
Die TMUs sind von den Shader-ALUs entkoppelt. Was aber bleibt, ist die Abhängigkeit Quad-TMU A <-> Quad-ALU A.
"Okto"-TMUs sind IMO denkbar, wenn diese parallel die Quads einer Quad-ALU bearbeiten. Ein Pixel-Thread besteht aus vier * (vier Quads), die vier Quad-ALUs bearbeiten 16 Pixel (also vier Pixel-Quads) Nr. 1, dann 16 Pixel Nr. 2, 16 Pixel Nr. 3 und anschließend Nr. 4.
Wenn man die Okto-TMU A in zwei voneinander unabhängige Quad-TMUs A1 bzw. A2 aufteilt, dann könnten diese parallel die Pixel-Quads Nr. 1 und Nr. 2 bearbeiten, die von der Quad-ALU A stammen.

Ich glaube, Ail holt gleich seine Pfanne raus. ;(

pervert
2008-06-08, 16:30:49
While Radeon 3870X2 relys on the PLX chip to communicate between the GPUs, 4870X2 GPUs will comunicate with each other through the memory. Since the GDDR5 is clocked at 1800, the total bandwidth will be roughly 160 GB/s at 1 Gigabyte through the 256bit-bus, compaired to the 8 GB/s of the PLX chip of the HD3870x2. Also 4870x2 WILL NOT have micro studdering.
Wie kommen die auf die 160GB Bandbreite, wenn eine 4870 schon 123GB hat? Sollte das nicht die doppelte Bandbreite sein?

Oder hat man durch die neue Speicheranbindung nun zwar volle/echte 1024MB wie bei einer Single-Chip Karte und verliert dafür die Bandbreite einer 2x512MB Lösung??

Wird spannend...

davidzo
2008-06-09, 00:43:21
Einen Teil des speicherinterfaces für eine punkt-zu punkt verbindung zu benutzen fände ich jedenfalls interessant, riecht aber objektiv gesehen ziemlich komisch, ich denke nicht dass das mit einem normalen dram controller möglich ist bzw. sich vom transistorbudget aus lohnt.

Im Ringbus eine Haltestelle einzulegen, speziell für Crossfire, das hatte ich mir bsiher überlegt. AMDs HT 3.0 ist relativ transistorsparend und erprobt. Mit 32bit wäre es eher etwas für einen mainstreamchip (40gb/s komplett bei 2,6Ghz), aber man könnte das ja auf 64 oder 128bit aufbohren bzw. eben genau wie bei den Opterons einfach mehrere HTlinks bündeln.
Beim einem performancechip wie dem rv770 würde ich zum beispiel 3x 32bit Ht 3.0 links auf 2-3Ghz für sinnvoll halten.
Damit könnte man dann optional zwei ode rmehr Grafikchips schnell miteinander verbinden.
Fusion wäre damit auch gelöst, das GPUdie würde einfach per HTlink an das Prozessordie gekoppelt sein und so direkten zugriff auf prozessorcache und speichercontroller haben.

Leider traue ich ATI derzeit eine so mutige Lösung nicht zu. Dazu ist der RV770 zu alt und ATI zu langsam. Ich denke mit solchen features wie memorysharing bei Crossfire werden wir erst in de rnächsten Generation etwas sehen.
Memory sharing ist nicht nur wichtig um Speicher zu sparen, sondern auch um von AFR endlich wegzukommen. Supertiling wäre dann endlich effizient und theoretisch wäre es sogar möglich effizientes loadbalancing zwischen zwei grafikchips zu betreiben bzw. vorverarbeitete werte vom einen chip auf den anderen zu übertragen für die weiterberechnung.

Cpl. Dwayne Hicks
2008-06-09, 04:00:49
Die TMUs sind von den Shader-ALUs entkoppelt. Was aber bleibt, ist die Abhängigkeit Quad-TMU A <-> Quad-ALU A.
"Okto"-TMUs sind IMO denkbar, wenn diese parallel die Quads einer Quad-ALU bearbeiten. Ein Pixel-Thread besteht aus vier * (vier Quads), die vier Quad-ALUs bearbeiten 16 Pixel (also vier Pixel-Quads) Nr. 1, dann 16 Pixel Nr. 2, 16 Pixel Nr. 3 und anschließend Nr. 4.
Wenn man die Okto-TMU A in zwei voneinander unabhängige Quad-TMUs A1 bzw. A2 aufteilt, dann könnten diese parallel die Pixel-Quads Nr. 1 und Nr. 2 bearbeiten, die von der Quad-ALU A stammen.

Ich glaube, Ail holt gleich seine Pfanne raus. ;(

Das fett gedruckte hat mich jetzt total verwirrt... :redface:

Bearbeitet jetzt jeder Cluster oder jeder Vec4+1 SP die 16 Pixel von denen du redest?

Ich dachte immer dass jeder Vec4+1 SP einen RGBA Quad und eine skalare Sonderfunktion berechnet... habe ich das richtig verstanden? Also berechnen Nr 1, 2, 3 und 4 jeweils nur einen Quad (4 Pixel (+ Sonderfunktion)) und nicht 16?

Also bearbeitet jede Quad ALU (bestehend aus 4 x vec4+1) 16 Pixel Quads, sprich 4 x RGBA.... somit wird jeder SP Cluster mit 4 Pixel threads gefüttert... richtig?

Manchmal denke ich ich verstehs, und dann wieder doch nicht... ;(

naja ich muss los ins College! Bis später! :smile:

Gast
2008-06-09, 07:52:39
Das fett gedruckte hat mich jetzt total verwirrt... :redface:

Bearbeitet jetzt jeder Cluster oder jeder Vec4+1 SP die 16 Pixel von denen du redest?

Ich dachte immer dass jeder Vec4+1 SP einen RGBA Quad und eine skalare Sonderfunktion berechnet... habe ich das richtig verstanden? Also berechnen Nr 1, 2, 3 und 4 jeweils nur einen Quad (4 Pixel (+ Sonderfunktion)) und nicht 16?

Also bearbeitet jede Quad ALU (bestehend aus 4 x vec4+1) 16 Pixel Quads, sprich 4 x RGBA.... somit wird jeder SP Cluster mit 4 Pixel threads gefüttert... richtig?

Manchmal denke ich ich verstehs, und dann wieder doch nicht... ;(

naja ich muss los ins College! Bis später! :smile:

eigentlich richtig so. was er jetzt tun würde, wäre 2x 8 pixel statt 4x4

reunion@work
2008-06-09, 09:24:44
Also doch 800 MADD SPs?!

http://img407.imageshack.us/img407/389/attachment4248b32ewz7.jpg (http://imageshack.us)
http://www.nordichardware.com/news,7841.html

Wenn man sich die Leistungsspekus für RV770 anschaut, dann treibt dieser nun definitiv die FLOPs-Vergleiche absurdum.
Mal sehen ob man wenigstens unter GPGPU mehr herausholen kann.

Aber da kommt sicherlich wieder ein Slide-War auf uns zu: "Why is the competitor not able to offer 1 TFLOPs on his $649 solution, while we can offer it for $229" oder so... X-D

1.2TFLOP? 800SPs? 256mm²? Ich glaube ich bin im falschen Film.

Schlammsau
2008-06-09, 10:03:37
Weitere Hinweise zur Leistung der HD 4870 X2 (http://www.computerbase.de/news/hardware/grafikkarten/ati/2008/juni/weitere_hinweise_leistung_hd_4870_x2/)
Darüber hinaus haben deren Vöglein auch davon gesungen, dass das Problem mit den Mikrorucklern mit der 4000-er-Serie (oder zumindest auf der Radeon HD 4870 X2) der Vergangenheit angehören soll. Der genannte Grund, nämlich der, dass die Kommunikation der beiden GPUs nicht über einen Bridge-Chip sondern den Grafikkartenspeicher stattfinden soll, scheint zurzeit allerdings wenig einleuchtend, bleibt das Grundproblem der AFR-Technologie doch auch über einen anderen Kommunikationsweg erhalten.

AnarchX
2008-06-09, 10:07:09
Wurde doch schon vor Seiten gepostet, nur hat es diesmal CB vonn NordicHW abgeschrieben, die es von VR-Zone abgeschrieben haben....

Und wenn man sich den R700-Kühler, aus der sehr sicheren Quelle Chiphell anschaut, ist da eindeutig das Pad für das PCIe-Switch erkennbar, ausserdem müssten für sinnvolles Shared-Memory die Dies deutlich näher bzw. auf einem Package sitzen.

Gast
2008-06-09, 10:30:29
Ausserdem erfordert Shared-Memory ein erhebliches Umstricken des Chips und dafür ist bei AMD kein Geld da.

Cpl. Dwayne Hicks
2008-06-09, 10:48:56
Geld gibt es wie Sand am Meer... man muss nur wissen wie man die Leute dazu überredet es einem zu geben. :smile:

Schlammsau
2008-06-09, 10:50:29
Wurde doch schon vor Seiten gepostet, nur hat es diesmal CB vonn NordicHW abgeschrieben, die es von VR-Zone abgeschrieben haben....

Und wenn man sich den R700-Kühler, aus der sehr sicheren Quelle Chiphell anschaut, ist da eindeutig das Pad für das PCIe-Switch erkennbar, ausserdem müssten für sinnvolles Shared-Memory die Dies deutlich näher bzw. auf einem Package sitzen.

welche Stelle meinst du auf dem Pic? Könntest du sie markieren?

AnarchX
2008-06-09, 11:59:51
http://img372.imageshack.us/img372/9631/plxog9.th.jpg (http://img372.imageshack.us/my.php?image=plxog9.jpg)

Erkennt man halt nicht auf dem ersten Blick bzw. einem schlecht kalibriertem Monitor.

Schlammsau
2008-06-09, 12:04:16
http://img372.imageshack.us/img372/9631/plxog9.th.jpg (http://img372.imageshack.us/my.php?image=plxog9.jpg)

Erkennt man halt nicht auf dem ersten Blick bzw. einem schlecht kalibriertem Monitor.

Du hast recht!
Nur kann man mit Sicherheit sagen, dass dort auch ein Brückenchip wie beim R680 verbaut wurde. Oder es evtl. eine andere Lösung ist? Denkbar wäre es zumindest!

K4mPFwUr$t
2008-06-09, 12:06:31
hieß es nicht man hätte einen eigenen bridgechip entwickelt weil der PLX zu teuer war?

AnarchX
2008-06-09, 12:07:32
hieß es nicht man hätte einen eigenen bridgechip entwickelt weil der PLX zu teuer war?
Naja, es ist ja noch nicht klar von welchem Hersteller das verbaute PCIe-Switch sein wird.

deekey777
2008-06-09, 12:13:39
http://img372.imageshack.us/img372/9631/plxog9.th.jpg (http://img372.imageshack.us/my.php?image=plxog9.jpg)

Erkennt man halt nicht auf dem ersten Blick bzw. einem schlecht kalibriertem Monitor.
Du Unwissender! Das ist der externe DPP für PhysX und Video-Encoding!

Du hast recht!
Nur kann man mit Sicherheit sagen, dass dort auch ein Brückenchip wie beim R680 verbaut wurde. Oder es evtl. eine andere Lösung ist? Denkbar wäre es zumindest!
Die andere Möglichkeit wäre, dass der Kühlkörper vom R680 1:1 übernommen wurde, ohne dass an "R700" angepasst wurde.

S940
2008-06-09, 13:05:09
Die andere Möglichkeit wäre, dass der Kühlkörper vom R680 1:1 übernommen wurde, ohne dass an "R700" angepasst wurde.
Jo gute Frage, ist es denn sonst der gleiche Kühler, wie bei der aktuellen X2 ?

ciao

Alex

Gast
2008-06-09, 13:31:49
http://www.fudzilla.com/index.phpoption=com_content&task=view&id=7790&Itemid=1

Gast
2008-06-09, 13:32:26
http://www.fudzilla.com/index.php?option=com_content&task=view&id=7790&Itemid=1

Gast
2008-06-09, 14:23:21
Im Ringbus eine Haltestelle einzulegen, speziell für Crossfire, das hatte ich mir bsiher überlegt. AMDs HT 3.0 ist relativ transistorsparend und erprobt. Mit 32bit wäre es eher etwas für einen mainstreamchip (40gb/s komplett bei 2,6Ghz), aber man könnte das ja auf 64 oder 128bit aufbohren bzw. eben genau wie bei den Opterons einfach mehrere HTlinks bündeln.
Beim einem performancechip wie dem rv770 würde ich zum beispiel 3x 32bit Ht 3.0 links auf 2-3Ghz für sinnvoll halten.
Damit könnte man dann optional zwei ode rmehr Grafikchips schnell miteinander verbinden.
Fusion wäre damit auch gelöst, das GPUdie würde einfach per HTlink an das Prozessordie gekoppelt sein und so direkten zugriff auf prozessorcache und speichercontroller haben.


halte ich auf einem package durchaus für möglich, nur würde man es dann viel intelligenter machen.

in dem fall hätte man einen IO-DIE mit speicherinterface, DAC, videoprozessor etc. (alles was man eben nur 1x braucht) und wenn man es ganz toll macht noch ein paar recheneinheiten für die desktopdarstellung und zusätzlich mehrere DIEs zum rechnen (die im bedarf zum stromsparen evtl. auch abgeschaltet werden können)

Schlammsau
2008-06-09, 14:27:34
Du Unwissender! Das ist der externe DPP für PhysX und Video-Encoding!


Die andere Möglichkeit wäre, dass der Kühlkörper vom R680 1:1 übernommen wurde, ohne dass an "R700" angepasst wurde.

Haleluja......ich bin sowas von gespannt, ob diese letzte Hürde genommen wurde!

frix
2008-06-09, 15:22:42
für wann ist denn nochmal die 4870 x2 angekündigt?

w0mbat
2008-06-09, 15:24:37
Die ist noch gar nicht angekündigt, wird aber wohl so ~3 Wochen nach dem RV770 kommen.

tombman
2008-06-09, 15:50:29
Haleluja......ich bin sowas von gespannt, ob diese letzte Hürde genommen wurde!
Das war ne Verarsche von deekey777 ..rofl.

tombman
2008-06-09, 15:51:31
Die ist noch gar nicht angekündigt, wird aber wohl so ~3 Wochen nach dem RV770 kommen.
Macht ned viel aus, 2x HD4780 @ CF ist ja schnell gebenched ;)

dr_mordio
2008-06-09, 16:06:22
Macht ned viel aus, 2x HD4780 @ CF ist ja schnell gebenched ;)

aber wenn sich irgendwann was bei den X2 karten ändert,egal ob mit R700 oder R800, und diese als ein singlechip arbeiten... dann kann man CF und X2 nicht mehr vergleichen.
denn bei CF kann man microrucklern nur auf treiberebene beikommen, da die chips immer getrennt bleiben. bei den X2-karten soll esja über kurz oder lang zum memorycharing und zum 2chips als einer kommen.

daher gebe ich auf die CF benches nicht viel. bis R700 da ist.

MFG
Alex

tombman
2008-06-09, 16:08:13
aber wenn sich irgendwann was bei den X2 karten ändert,egal ob mit R700 oder R800, und diese als ein singlechip arbeiten... dann kann man CF und X2 nicht mehr vergleichen.
denn bei CF kann man microrucklern nur auf treiberebene beikommen, da die chips immer getrennt bleiben. bei den X2-karten soll esja über kurz oder lang zum memorycharing und zum 2chips als einer kommen.

daher gebe ich auf die CF benches nicht viel. bis R700 da ist.

Aber die reine FPS performance wird man wohl benchen können, und das reicht erstmal völlig.

Und an Wundercf (TM) glaube ich erst wenn ich es sehe...

frix
2008-06-09, 16:08:38
jo schön wärs auf jeden fall wenn man die multi gpu probleme zumindest auf einer karte in den griff bekommt.

Gast
2008-06-09, 16:11:05
Ja und das wär doch auchmall ein anreiz für Kunden das teuerste flagschiff von Ati zu kaufen.Das wär ein guter schachtzug von Ati.Endlich wieder richtig geld verdienen.;)

Sorkalm
2008-06-09, 16:12:29
daher gebe ich auf die CF benches nicht viel. bis R700 da ist.

Neuerungen in der Hinsicht kommen wohl erst mit dem R800, bei R700 hieß es bisher immer normale CF-Lösung. Der Bridge-Chip deutet auch darauf hin. ;)

dr_mordio
2008-06-09, 16:13:25
Aber die reine FPS performance wird man wohl benchen können, und das reicht erstmal völlig...

da hast du allerdings recht. na ich lasse mich echt mal überraschen was nun kommt.

MfG
Alex

w0mbat
2008-06-09, 16:21:56
Ich finde die aufgemalten Schrauben am Kuehler der HD4870 so witzig (die HD4850er hat die auch) ;D
http://img291.imageshack.us/img291/9963/roflvq6.jpg

Adam D.
2008-06-09, 16:29:24
Sieht doch gleich viel hochwertiger aus ;)

Gast
2008-06-09, 16:29:49
Vielleicht hat die 4800 Serie einen Hardware-Scheduler für die Bildausgabe verbaut, um das Mikroruckelproblem zu verhindern.

GeneralHanno
2008-06-09, 16:30:20
steht wahrscheinlich so im referenzdesign drin ... :biggrin:

PS: den genauen aufbau des cores kennen wir immer noch nicht ... :frown:

Gast
2008-06-09, 16:31:44
denn bei CF kann man microrucklern nur auf treiberebene beikommen, da die chips immer getrennt bleiben. bei den X2-karten soll esja über kurz oder lang zum memorycharing und zum 2chips als einer kommen.


memorysharing bringt für mikroruckler rein garnichts, wenn weiter mit AFR gerendert wird.

nagus
2008-06-09, 19:32:08
http://img372.imageshack.us/img372/9631/plxog9.th.jpg (http://img372.imageshack.us/my.php?image=plxog9.jpg)

Erkennt man halt nicht auf dem ersten Blick bzw. einem schlecht kalibriertem Monitor.

wer sagt, dass das der richtige kühler einer 4870X2 ist? das weiß doch auch nicht wirklich jemand mit sicherheit...

AnarchX
2008-06-09, 19:34:07
Sicher, aber die RV770-Kühler und PCB-Bilder die Chiphell am Anfang des Jahres gezeigt hat, haben sich auch bewahrheitet. ;)

nagus
2008-06-09, 19:37:23
und was hält ati davon ab, den alten referenzlüfter einer x2 zu verwenden? muss ja nicht zwangsweise heißen, nur weil da platz für einen chip ist, dass da wirklich einer sitzt.

... oder ist ist einfach eine gezielte fehlinformation die ati rausgibt.. zur verwirrung. die gerüchte mit den 480SP hat sich ja auch sehr gut behalten... genauso wie die die-size von 256qmm.

kann natürlich sein, dass das blödsinn ist... aber man kann nie wissen.

Gast
2008-06-09, 20:27:21
wieso sollte der chip jetzt plötzlich nicht mehr benötigt werden?
Die Chips können zwar vielleicht über den Vram kommunizieren, aber mit der CPU immer noch über PCIE.
Und dafür ist bei 2 Chips halt noch ein PCIE Switch notwendig.

Es heißt ja nicht, dass der Chip die Ursache allen Übels ist.

Gast
2008-06-09, 21:26:48
Die Chips können zwar vielleicht über den Vram kommunizieren,

wie sollte das funktionieren, so lange der speichercontroller in der GPU liegt?

SavageX
2008-06-09, 21:37:22
wie sollte das funktionieren, so lange der speichercontroller in der GPU liegt?

Man könnte den Ringbus auftrennen und über eine Schnittstelle mit dem Ringbus der anderen GPU verbinden. Sowas wird man wohl früher oder später sehen - keine Ahnung, ob jetzt schon.

Ein entsprechendes Setup könnte auch die Microruckler loswerden, wenn die GPUs zusammen an einem Frame rendern.

Gast
2008-06-09, 21:43:50
Man könnte den Ringbus auftrennen und über eine Schnittstelle mit dem Ringbus der anderen GPU verbinden. Sowas wird man wohl früher oder später sehen - keine Ahnung, ob jetzt schon.

Ein entsprechendes Setup könnte auch die Microruckler loswerden, wenn die GPUs zusammen an einem Frame rendern.

Eh der Ringbus is nur ein Marketingname, es sich als Ring vorzustellen ist eine riesen Vereinfachung, aber es ist kein echter Ring wenn du das so sehen magst, da is nix mit auftrenne...

Gast
2008-06-09, 21:46:17
Man könnte den Ringbus auftrennen und über eine Schnittstelle mit dem Ringbus der anderen GPU verbinden. Sowas wird man wohl früher oder später sehen - keine Ahnung, ob jetzt schon.

das kann nicht funktionieren, wir haben 2 speichercontroller, also braucht auch jeder davon seinen eigenen speicher.

nagus
2008-06-09, 21:57:53
vielleicht benutzt die eine GPU den speichercontroller der andern GPU mit ;)

Gast
2008-06-09, 22:26:56
vielleicht benutzt die eine GPU den speichercontroller der andern GPU mit ;)

wie willst du das adressieren? in dem fall würde eine GPU die daten, welche die andere braucht überschreiben können.

Schlammsau
2008-06-09, 22:37:11
http://www.forum-3dcenter.org/vbulletin/showthread.php?p=6569876#post6569876
http://i26.tinypic.com/27x1303.jpg

deekey777
2008-06-09, 22:37:49
http://i26.tinypic.com/27x1303.jpg
Und was soll dieses Bild darstellen?

Gast
2008-06-09, 22:41:32
Und was soll dieses Bild darstellen?

Steht doch alles dabei (außer der Treiber). Hat hier jemand Vergleichswerte?

HOT
2008-06-09, 22:44:10
memorysharing bringt für mikroruckler rein garnichts, wenn weiter mit AFR gerendert wird.
Das wird über den Treiber gelöst worden sein.

deekey777
2008-06-09, 22:44:24
Steht doch alles dabei (außer der Treiber). Hat hier jemand Vergleichswerte?
Dann hätte ich eine Erklärung, warum zwar Average-Tris bei 28 Mio sind, dagegen die per Frame bei nur 750.000?

Gast
2008-06-09, 22:49:09
Dann hätte ich eine Erklärung, warum zwar Average-Tris bei 28 Mio sind, dagegen die per Frame bei nur 750.000?

Bei 28 Mio Average-Tris/s und 750.000 Tris/Frame sinds etwa 37FPS (Average). Passt doch.

Gast
2008-06-09, 22:50:29
http://www.forum-3dcenter.org/vbulletin/showthread.php?p=6569876#post6569876
http://i26.tinypic.com/27x1303.jpg

ich zock nur auf 1680x1050,da ist vieleicht noch 2xaa,16xaf drin:)

Gast
2008-06-09, 22:58:19
Mit welcher Karte wurde getestet?

Gast
2008-06-09, 22:58:36
Und was soll dieses Bild darstellen?


3700fps :D

Superheld
2008-06-09, 22:58:54
ohne Quelle:|

..hat wohl schnell ein Gast gemacht;)

deekey777
2008-06-09, 23:04:57
Bei 28 Mio Average-Tris/s und 750.000 Tris/Frame sinds etwa 37FPS (Average). Passt doch.
Da steht, alles sei auf Very High, aber 750.000 pro Frame klingen irgendwie zu niedrig.
So oder so: keine Quellenangabe, sehr fragwürdig, einer Diskussion nicht wert.

tombman
2008-06-10, 01:45:56
das fake Bild wurde schon 2x gelöscht, kommt aber immer wieder...

und 700K avg pro frame ist bullshit bei very high, das spielt sich eher bei 2 Mio/frame ab ;)

die fps sind auch bullshit. selbst wenns nur 37fps wären, wär das GTX280 SLI Niveau, aber niemals HD4870 Niveau.

Schon erstaunlich wie leicht sich Anfänger reinlegen lassen...

Schlammsau
2008-06-10, 06:01:08
Was mich eine wenig verwirrt ist diese neue GPU Kühler!
Schaut mal für welche Karten der vorgesehen ist (Gute Augen vorausgesetzt)! GT200 und RV770!
So ein fetter Kühler für eine vermeintlichschwache Karte.
Also entweder der GT200 verbraucht nicht viel, oder der RV770 ist stärker als wir denken!
http://resources.vr-zone.com/computex08/chassis/IMG_0215.jpg

Gast
2008-06-10, 06:43:20
Ich denke eher weniger, das man daraus eine recht genaue Einschätzung über die Leistungsfähigkeit des RV770 machen kann. Ein Hersteller eines solchen Kühlers wird natürlich sich keinem Markt verschließen wollen und versucht so, so viele Grafikkarten wie möglich zu unterstützen.

Gast
2008-06-10, 06:43:41
Oder c) Der Kühler ist für die GTX gerade noch ausreichend und für die RV770 überdimensioniert...

Schlammsau
2008-06-10, 07:07:14
oder d:
die RV770XT hat ja auch eine TDP von ~160Watt! Dann stimmt das wohl wieder!

SavageX
2008-06-10, 08:04:11
das kann nicht funktionieren, wir haben 2 speichercontroller, also braucht auch jeder davon seinen eigenen speicher.

Das heisst nicht, dass der Speicher nicht einen zusammenhängenden Bereich bilden kann. Siehe ein Opteron Mehrsockelsystem. Allerdings liegt die Speicherbandbreite von GPUs um einiges höher, so dass der Link recht dick sein muss.

SavageX
2008-06-10, 08:09:17
Eh der Ringbus is nur ein Marketingname, es sich als Ring vorzustellen ist eine riesen Vereinfachung, aber es ist kein echter Ring wenn du das so sehen magst, da is nix mit auftrenne...

Selbst wenn da derzeit kein glatter Ring drinliegt: Möglich ist es allemal. Hat ja niemand behauptet, dass dies AMD gratis in den Schoß fällt oder dass die jetzt anstehende Generation schon darüber verfügt.

HPVD
2008-06-10, 08:41:33
ATI Radeon HD 48x0 kommen am 25. Juni

Wie AMD seinen Partnern mitgeteilt haben soll, wird der endgültige Launchtermin nocheinmal zwei Tage später sein, als der zuletzt durchs Web gegeisterte 23. diesen Monats.

Weiterhin sollen nach Informationen von VR-Zone auch die endgültigen Taktraten festgelegt worden sein. Diese liegen mit 625MHz und 750MHz zwar unter denen der 38x0-Reihe, jedoch bringt der RV770 gegenüber dem RV670 die Hälfte mehr Shader-Einheiten und die doppelte Anzahl an Texturierungseinheiten mit. Verbunden mit der erhöhten Taktrate des Speichers auf knapp 2 bzw. 4GHz dank GDDR5-Technologie, soll die 4870 dann als schnellste Single-GPU-Grafikkarte aus dem Hause AMD bzw. ATI an den Start gehen und der Konkurrenz mit einem sehr guten Preis/Leistungsverhältnis und nicht durch reine Rohleistung das fürchten lehren.


http://www.planet3dnow.de/cgi-bin/newspub/viewnews.cgi?category=1&id=1213031066

Adam D.
2008-06-10, 08:44:24
Jop, das klingt doch sehr realistisch. Realistischer als die 825+MHz für die HD4870. Und ich dachte, der 25. Juni wäre von Anfang an Launch-Tag? Naja. Dazu noch 1,8GHz GDDR5 zu 'nem guten Preis und das wird echt ein feines Kärtchen.

Gast
2008-06-10, 09:14:03
Das wird über den Treiber gelöst worden sein.

Bislang ist da nichts gelöst worden.

Gast
2008-06-10, 09:16:45
Also entweder der GT200 verbraucht nicht viel, oder der RV770 ist stärker als wir denken!



Weder noch, der RV770 frisst nur unglaublich viel Strom für seine schwache Performance.

robbitop@work
2008-06-10, 09:18:09
Ohne Shaderdomain komme ich bei den Angaben (96x Vec5 ALUs) aber nur auf 720 GFLOPS/s. Auf einer ATI-Folie (die hier im Forum lag) stand IIRC aber mal was von 1,3 TFLOPS/s.
Irgendwie verwirrend.

AnarchX
2008-06-10, 09:27:33
Weil es wohl eben nicht 96xVec5 sind, sondern günstig, (ineffizienter) angeordnete 160xVec5.

Hier nochmal der Link zu meiner Vorstellung zum Aufbau:
http://www.forum-3dcenter.org/vbulletin/showpost.php?p=6565104&postcount=659
... auf die mich Cpl. Dwayne Hicks gebracht hat.

reunion@work
2008-06-10, 09:57:39
Ohne Shaderdomain komme ich bei den Angaben (96x Vec5 ALUs) aber nur auf 720 GFLOPS/s. Auf einer ATI-Folie (die hier im Forum lag) stand IIRC aber mal was von 1,3 TFLOPS/s.
Irgendwie verwirrend.

Es sind auch 800SPs oder 160Vec5-ALUs für RV770. Von RV670 aus also immerhin eine Erhöhung um Faktor 2.5.

Cpl. Dwayne Hicks
2008-06-10, 09:59:40
Ineffizienter?

Ist das weil der Thread Scheduler/Compiler es jetzt noch schwerer hat, indem er anstelle von 4 jetzt 8 Vec4+1 SPs pro Cluster mit parallelen, unabhängigen Instruktionen füttern muss?

reunion@work
2008-06-10, 10:13:32
Weil es wohl eben nicht 96xVec5 sind, sondern günstig, (ineffizienter) angeordnete 160xVec5.

Hier nochmal der Link zu meiner Vorstellung zum Aufbau:
http://www.forum-3dcenter.org/vbulletin/showpost.php?p=6565104&postcount=659
... auf die mich Cpl. Dwayne Hicks gebracht hat.

Deine Zeichung würde immerhin 40 TMUs bedeuten. Wie will man das alles in ein nur um 33% größeres Die bringen will als bei RV670? Mittlerweile glaube ich das RV770 wesentlich größer wird. Die 800SPs sind faktisch bestätigt, noch mehr in Richtung ALU wird man IMHO kaum Rücken.

AnarchX
2008-06-10, 10:16:40
Deine Zeichung würde immerhin 40 TMUs bedeuten.
Insgesamt 40TFs die wohl günstiger als 8 oder gar 10 TUs, mit diesem ganzen Kleinkram, sein dürften.


Wie will man das alles in ein nur um 33% größeres Die bringen will als bei RV670? Mittlerweile glaube ich das RV770 wesentlich größer wird.
Der Die wurde doch schon enthüllt und entspricht den bekannten ~260mm², aber kannst ja auch nochmal nachmessen:
http://www.bit-tech.net/news/2008/06/05/amd-hd-4850-rv770-gpu-die-shot/1
;)


Die 800SPs sind faktisch bestätigt, noch mehr in Richtung ALU wird man IMHO kaum Rücken.
Das glaube ich auch, vorallem der Schritt auf die eher seltsame Zahl von 800SPs spricht in meinen Augen für die Octa(oder 2x Quads)-TMU/ALU-Theorie.

Gast
2008-06-10, 10:30:07
Insgesamt 40TFs die wohl günstiger als 8 oder gar 10 TUs, mit diesem ganzen Kleinkram, sein dürften.


Der Die wurde doch schon enthüllt und entspricht den bekannten ~260mm², aber kannst ja auch nochmal nachmessen:
http://www.bit-tech.net/news/2008/06/05/amd-hd-4850-rv770-gpu-die-shot/1
;)


Das glaube ich auch, vorallem der Schritt auf die eher seltsame Zahl von 800SPs spricht in meinen Augen für die Octa(oder 2x Quads)-TMU/ALU-Theorie.


Das alles passt doch jetzt mal gar nicht zu den Behauptungen von Ail, dass der RV770 völlig überschätzt wird und das man da nur ein paar Einheiten angeklebt hat die nicht mal so richtig was bringen...

Was stimmt denn nun?

Ist er da seinen Nvidia-Agitations-Quellen aufgesessen?

Gast
2008-06-10, 10:32:27
Insgesamt 40TFs die wohl günstiger als 8 oder gar 10 TUs, mit diesem ganzen Kleinkram, sein dürften.




Ist das so gemeint dass es mehr Adressierungs-Einheiten gibt?

AnarchX
2008-06-10, 10:35:52
Ich wüsste nicht, wo in meinem Schema eine großartige Effizienz gezeigt wird:

- ALUs weiterhin nur in 4 SIMDs angeordnet
- TMUs wohlmöglich ineffiziente Octa-TMUs, welche 8 benachbarte Pixel lesen müssen, anstatt 4, was zwar Leistung erhöht, aber eben nicht so gut wie 2x Quad-TMUs ist.

Wohl etwas in die Richtung, der 3-fache ALU-Zahl bei R580 gegenüber R520, die kaum Die-Size und Transistoren gekostet haben und eben meist nicht wirklich viel brachte, so kam RV570 in shaderlastigen Szenarios auf R520 Niveau, bei doppelte theoretischen Aritmetikleistung.

Ist das so gemeint dass es mehr Adressierungs-Einheiten gibt?
Jede TU bei R6xx enthält ja 8TAs und 20 Sampler, letzere sollen wohl kaum Verwendung finden und war eher eine falsche Einschätzung der Anforderungen von 2007.

Gast
2008-06-10, 10:47:16
Ich wüsste nicht, wo in meinem Schema eine großartige Effizienz gezeigt wird:

- ALUs weiterhin nur in 4 SIMDs angeordnet
- TMUs wohlmöglich ineffiziente Octa-TMUs, welche 8 benachbarte Pixel lesen müssen, anstatt 4, was zwar Leistung erhöht, aber eben nicht so gut wie 2x Quad-TMUs ist.

Wohl etwas in die Richtung, der 3-fache ALU-Zahl bei R580 gegenüber R520, die kaum Die-Size und Transistoren gekostet haben und eben meist nicht wirklich viel brachte, so kam RV570 in shaderlastigen Szenarios auf R520 Niveau, bei doppelte theoretischen Aritmetikleistung.



So wurde das aber nie gesagt. Es war von fehlenden Änderungen die Rede aufgrund fehlenden R&D.


Jede TU bei R6xx enthält ja 8TAs und 20 Sampler, letzere sollen wohl kaum Verwendung finden und war eher eine falsche Einschätzung der Anforderungen von 2007.

Was sind Sampler. Warum mehr weniger TA's. Machen nicht nur mehr TA's Sinn(wie bei G80)?

Gast
2008-06-10, 11:05:01
Bin gespannt =)

Today i will post HD4850 results ... i am waiting only for drivers, cards are already at home now ... . .. stay tuned.

http://www.xtremesystems.org/forums/showthread.php?p=3049772#post3049772