PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : R580 schon Anfang 2006?


Seiten : 1 2 [3] 4 5 6 7

Sunrise
2005-12-23, 22:02:59
Sagen wir er ist ungefähr soviel Refresh wie der G70 ein refresh des NV40 war.Ja, das ist ein guter Maßstab, damit kann auch ich leben.

Die gelbe Eule
2005-12-23, 22:09:57
Du widersprichst dir hier sehr deutlich.

Du müsstest inzwischen doch selbst am Besten wissen, dass "Normalos" eben nicht die Zielgruppe einer R520 / R580 oder einer GTX512 sind oder sein werden. Das sind Performance-orientierte Klientel, die nur einen Bruchteil der eigentlichen Umsätze ausmachen. Ich habe bereits versucht, dich in die Richtung zu lenken, dass du dich nicht immer an den Top-Produkten des jeweiligen IHVs orientierst, weil es keinen Sinn macht, sich daran aufzuhängen. Dieser Markt ist verschwindend gering, er dient als "technology driver", aber sorgt nicht unbedingt für prall gefüllte Taschen, nicht bei den Mengen und den Margen, die derzeit bei "nur" etwa 28% liegen.
.

Dann lies Dir nochmal den Threatitel durch, dann schau mal welche Karten herauskommen werden und schon merkst Du, das es nur um Top-Produkte geht.
Das andere RV5XX kommen, steht nirgends. Also will ATi den schwindend geringen Markt bedienen, weil die paar % nicht zufrieden mit Ihrer X1800XT sind?
Es geht um Prestige, um nichts anderes.

deekey777
2005-12-23, 22:14:22
Daß hier nichts von den Midrange-Produkten steht, liegt daran, daß ihnen ein extra Thread gewidmet wurde.

Sunrise
2005-12-23, 22:37:13
Dann lies Dir nochmal den Threatitel durch, dann schau mal welche Karten herauskommen werden und schon merkst Du, das es nur um Top-Produkte geht. Das andere RV5XX kommen, steht nirgends. Also will ATi den schwindend geringen Markt bedienen, weil die paar % nicht zufrieden mit Ihrer X1800XT sind?
Es geht um Prestige, um nichts anderes.Es geht um "Performance and Technology Leadership" und OEM-Verträge, die im Frühjahr abgeschlossen werden. Prestige ist nur ein Wort, dass allzu gerne benutzt wird, weil man eigentlich nicht weiß, wie man es genau einordnet.

R580 wird keine sonderlich hohen Margen vorweisen können, da deutlich komplexer als R520 und die Kunden, die bereits R520 gekauft haben, die werden diese Karten womöglich auch behalten, sollten sie nicht so stark fixiert auf das High-End-Segment (wie einige hier) sein.

Banshee18
2005-12-23, 22:37:44
Aber man sollte auch bedenken, dass die 6600Gt noch ne echte NV4X karte ist, ohne jegliche Verbesserungen der 7800er Serie.

Hatte die nicht schon einige Verbesserungen, die nV40 nicht hatte und war somit effizienter? Coda?

IVN
2005-12-24, 08:35:20
Hatte die nicht schon einige Verbesserungen, die nV40 nicht hatte und war somit effizienter? Coda?
Ja,das ist richtig.Etwas wurde an der PSE Engine verbessert. ;)



p.s. frag Aths,er weiss mehr dazu.

horn 12
2005-12-24, 09:46:57
also ATI bringt mit Sicherheit mit dem R580 Chip eine NEUE überärbeitete X1600 XT , welche dann wohl die X1700 XT werden wird .
denke auch dass die Performance auf dem Niveau einer X800 XT PE in etwa liegen dürfte um NV mal Paroli bieten zu können .
auch mit der Verfügbarkeit dieser Karte kann man dann sofort rechnen
denn denen eine X1600 XT zu langsam ist - können sich die X1700 XT kaufen .

Palpatin
2005-12-24, 17:59:44
Denk eher das evtl ne x1700 mit 8pipes kommt ob dann mit 256 bit oder 128bit muss man abwarten mit 256bit könnte sie der x1800 gefährlich werden.

robbitop
2005-12-24, 20:48:08
Denk eher das evtl ne x1700 mit 8pipes kommt ob dann mit 256 bit oder 128bit muss man abwarten mit 256bit könnte sie der x1800 gefährlich werden.
dazu fehlt bei nur 2 Quadpipes massiv Füllrate.

-error-
2005-12-25, 00:36:12
Sy, es wurde bestimmt schonmal erwähnt!

Aber warum ist der R500 eigendlich so fortschrittlich und der R520 nicht? Das ist doch voll die Kundenverarsche :(

Ich habe nicht viel Ahnung von den Gebiet, aber ich finde das einfach nur gemein. :frown:

deekey777
2005-12-25, 01:09:36
Weil "R500" der falsche Name für diesen Chip ist? ;) :D

-error-
2005-12-25, 01:13:24
Der Name ist do irrelevant! ATI zeigt mit dem R500, oder wie auch immer der heißen mag, was technisch möglich ist! Der R520 ist eine lahme Krücke dagegen, das ist einfach nur ungerecht.

mapel110
2005-12-25, 01:14:13
Weil "R500" der falsche Name für diesen Chip ist? ;) :D
Kann man drehen und wenden wie man will. R520 ist eigentlich auch falsch, wenn man das Featureset anschaut. Der sollte eher R495 oder so heißen. :smile:
Der Name ist do irrelevant! ATI zeigt mit dem R500, oder wie auch immer der heißen mag, was technisch möglich ist! Der R520 ist eine lahme Krücke dagegen, das ist einfach nur ungerecht.
Ich will erstmal 1080i oder 720p mit 4xAA sehen wollen, bevor ich das so sagen würde.

dildo4u
2005-12-25, 01:14:56
Der Name ist do irrelevant! ATI zeigt mit dem R500, oder wie auch immer der heißen mag, was technisch möglich ist! Der R520 ist eine lahme Krücke dagegen, das ist einfach nur ungerecht.
Falsch der R520 ist vom Speed her weit überlegen.

-error-
2005-12-25, 01:26:00
Falsch der R520 ist vom Speed her weit überlegen.

Aber der R500 hat doch 48 Pipes und ist eine Unifiedshader GPU?

deekey777
2005-12-25, 01:34:50
Aber der R500 hat doch 48 Pipes und ist eine Unifiedshader GPU?

Nein, 3 SIMD Kanäle mit je 16 ALUs. Die einen sagen, es sind 3 Pipelines, die anderen nur eine. Aber beim Xenos/C1 muß man schon etwas anders denken.

Wenn ich mich nicht irre, meinte Demirug, daß der Xenos mit den letzjährigen Highend-Grafikkarten gutmithalten kann, im Vergleich zum R520 oder dem G70 dagegen langsamer.

LordDeath
2005-12-25, 15:28:01
wie hoch ist denn die füllrate einer R500?

deekey777
2005-12-25, 15:38:20
Xenos oder C1 bitte.

Ich ratte mal blind 8 GT/s, ist aber bestimmt falsch.

reunion
2005-12-25, 15:44:00
Stimmt schon, wobei nur 8 ROPs zur Verfügung stehen, was allerdings nicht wirklich relevant sein sollte.

Ailuros
2005-12-26, 09:46:04
Hmmm es sind zwar 8 ROPs aber sie sind auch ueber 32c/64z faehig. 8 GTexels/s ja aber auch mit 4xMSAA.

Und vergleicht mir doch nicht bitte so stark vereinfacht Consolen-chips (die fuer kleinere Aufloesungen angepasst sind) mit PC-chips.

Frohe Weihnachten :)

horn 12
2005-12-26, 10:49:49
@ALL
in ca. 4 Wochen werden wir Bescheid wissen um den R580 und seine Verfügbarkeit-
aber glaubt mir ATI wird das Kind schon schaukeln und die KARTEN WERDEN DEFINITIV KAUFBAR SEIN - BEIM LAUNCH !

PS: Ati liefert schon gar keine Chips an die Graka Hersteller mehr aus, um somit freie Bahn beim R580 zu habenund um und sich nicht zu behindern.
Die X1800 XT wird langsam aber sicher vom Markt verschwinden und durch den R580 ersetzt werden .

robbitop
2005-12-26, 10:59:59
32 Farbwerte? AFAIK nein. Pro ROP ist nur ein Farbwert pro Takt drin. Allerdings 4 Tiefenwerte. Sind also 8c/32z.

Die ST Füllrate ohne MSAA sollte also nur 4 GP/sek betragen, aber wen interessiert das? Die Texelfüllrate liegt also bei 8GT/sek. Das bleibt auch bis 4xMSAA so. Auf der R3xx-R520 bleibt das nur bis 2xMSAA so.

reunion
2005-12-26, 12:19:06
ATi R580 will come in four versions: Countdown: T minus 30 days... (http://www.theinq.com/?article=28540)

ALTHOUGH SOME web sites reported that the upcoming R580 chip will come in three different versions, the fact is that R580 chip will replace the R520 line entirely. The new products will be named Radeon X1900XL, X1900XT and X1900XT CrossFire Edition. There is a rumour of another naming convention, with the names X1900XT ("T" instead of an "L"), X1900XTX (The Boss, King, Macho) and X1900XTX CrossFire Edition (albeit a little slower clocked than a big boss).
Besides this plain vanilla 3D boards, ATI will also rollout the refresh of All-in-Wonder product, which actually - was the reference board ATI is actually using to demonstrate the R580 chip to its valuable customers and partners. We haven't been able to confirm the clockspeeds of the product, but since we learned that new All-in-Wonder demo boards come with 1.26ns GDDR-3 memory, it isn't too hard to figure that possible memory clock for X1900XL(T?) is 1.5 GHz, giving out 48GB/s of bandwidth. That would be clear 16 GB/s wider than current AiW model, based on R520XL chip.

It looks like ATI wants to give every pixel to get the performance back... so the R520 will rest in peace after only three and half months. October 5th 2005 - January 24th, 2006.

Am 24. Januar solls also so weit sein.

Gandharva
2005-12-26, 15:22:06
XTX 512MB 650/775
XT 512MB 625/725
XT CF 512MB 625/725http://www.beyond3d.com/forum/showpost.php?p=658228&postcount=334

reunion
2005-12-26, 17:42:15
IMHO wären die Unterschiede zwischen "XT" und "XTX" viel zu gering, um eine neue Version zu rechtfertigen. Die "XTX" wird IMO höher takten.

Auch intressant:

It seems that R580 will be available at launch (same as what was indicated by ATi at their conference call at the end of November) and allocationlists for Europe, Middel East and Asia looks to indicate that ATi are indeed back on track.

aths
2005-12-26, 22:35:44
32 Farbwerte? AFAIK nein. Pro ROP ist nur ein Farbwert pro Takt drin. Allerdings 4 Tiefenwerte. Sind also 8c/32z.Das wäre mir neu. Mir ist atm nicht klar wie hoch der Color-Durchsatz ist, solange Farbkomprimierung greift, wenn man keine Polygonkantenpixel hat.

Mr. Lolman
2005-12-26, 22:47:55
Sry, wenn ich schonwieder frag:

Inwiefern unterscheidet sich der R580 vom R520?

deekey777
2005-12-26, 22:55:19
Sry, wenn ich schonwieder frag:

Inwiefern unterscheidet sich der R580 vom R520?

Der Lüfter wird sich in die andere Richtung drehen. X-D

Vierfacher RV530.
R580 16-1-3-1 -> 16TMUs/16Pipelines mit je 3 ALUs (Pixelshadern)/16ROPs und 8 oder 10 VS?
RV530 4-1-3-2
(RV560 8-1-3-x)

Winter[Raven]
2005-12-26, 23:45:42
Der Lüfter wird sich in die andere Richtung drehen. X-D

Vierfacher RV530.
R580 16-1-3-1 -> 16TMUs/16Pipelines mit je 3 ALUs (Pixelshadern)/16ROPs und 8 oder 10 VS?
RV530 4-1-3-2
(RV560 8-1-3-x)

Ich tippe auf 8 Vs, ATI wird alle Transis schon für die zusätzlichen Ulus brauchen.

robbitop
2005-12-26, 23:51:48
Das wäre mir neu. Mir ist atm nicht klar wie hoch der Color-Durchsatz ist, solange Farbkomprimierung greift, wenn man keine Polygonkantenpixel hat.
Was hat denn bitte die Farbkompression damit zu tun? Eine "herkömmliche" ROP kann pro Takt einen Farbwert in den Framebuffer schreiben oder lesen.
Die ROPs im NV31/36 vermochten sogar durch irgendeine Verschaltung 2 Farbwerte pro Takt zu lesen/schreiben.

AFAIK können die Dinger pro ROP einen Farbwert und einen Z Wert schreiben, allerdings bricht das Ganze bis zu 4xMSAA nicht ein. Sehr ähnlich, wie beim R3xx-R5xx, nur dass es dort bis 2xMSAA nicht einbricht. Könnte allerdings auch sein, dass man sogar ohne MSAA 4x Tiefenwerte lesen/schreiben kann. Dessen bin ich mir unsicher, allerdings meine ich gelesen zu haben, dass die 8 ROPs die ST Füllrate halbieren.

robbitop
2005-12-26, 23:53:28
Sry, wenn ich schonwieder frag:

Inwiefern unterscheidet sich der R580 vom R520?
Ist doch seit langem im Groben bekannt: der R580 bekommt den Pixelprozessor des RV530, welcher vom Featureset etwas neuer ist aber vor allem pro Quadpipe 3x so viele Allzweck ALUs besitzt.

reunion
2005-12-27, 00:08:15
32 Farbwerte? AFAIK nein. Pro ROP ist nur ein Farbwert pro Takt drin. Allerdings 4 Tiefenwerte. Sind also 8c/32z.



Es sind 32c/64z, das wurde schon hunderte Male bestätigt.

Ailuros
2005-12-27, 00:41:11
32 Farbwerte? AFAIK nein. Pro ROP ist nur ein Farbwert pro Takt drin. Allerdings 4 Tiefenwerte. Sind also 8c/32z.

Die ST Füllrate ohne MSAA sollte also nur 4 GP/sek betragen, aber wen interessiert das? Die Texelfüllrate liegt also bei 8GT/sek. Das bleibt auch bis 4xMSAA so. Auf der R3xx-R520 bleibt das nur bis 2xMSAA so.

Despite references to 192 processing elements in to the ROP's within the eDRAM we can actually resolve that to equating to 8 pixels writes per cycle, as well as having the capability to double the Z rate when there are no colour operations. However, as the ROP's have been targeted to provide 4x Multi-Sampling FSAA at no penalty this equates to a total capability of 32 colour samples or 64 Z and stencil operations per cycle.

http://www.beyond3d.com/articles/xenos/index.php?p=04

robbitop
2005-12-27, 09:04:25
http://www.beyond3d.com/articles/xenos/index.php?p=04
Das Zitat von AiL belegt meine Aussage ja. Die ROPs können nur an 8 Pixeln gleichzeitig arbeiten. Und da sie das bis 4xMSAA können, gibt man 32c/64z an. Wenn mans so ausdrückt, kann jede R300 16c und 16z, jede R420 32c und 32z. NV3x/4x sind bisher AFAIK die einzigen Chips bei denen die Bezeichnung auch so hinkommen würde. Bsw kann ein NV40 wirklich 16c und 32z bearbeiten.

r00t
2005-12-27, 10:03:05
http://www.hardware-mag.de/news.php?id=38927

wie wirkt sich das auf die leistung aus wenn man mehr ALUs hat?!

robbitop
2005-12-27, 10:14:58
Ja immer und immer mehr. Man schaue sich mal die Leistung der X1600XT an. Für eine 1-Quad VPU ist die ziemlich performant. Aritmetische Leistung wird immer wichtiger. Das sieht man sehr schön an Spielen wie FEAR. Und da werden noch mehr kommen (Unreal 3 bsw).

reunion
2005-12-27, 13:02:30
ATI's R580 gets faster clock on latest board (http://www.theinq.com/?article=28564)

ATI HAS ALREADY finished the design of R580 cards. We know it has new printed circuit boards (PCBs) too, for these cards as they have to accommodate the chips that are supposed to run at even higher speeds than R520. The R520 clocked at 625MHz has been available for some time and we still hope to see some serious quantities of Radeon X1800XT OC cards clocked at 700MHz.
We are still in the dark about the R580 clock speeds but we know they will end up faster than R520. At least it’s a different marchitecture so the performance should be on R580 side.

With 48 shader units and 16 pipelines this card ought to be significantly faster than R520 and it's just a little bit more than three weeks away from a world wide launch.

Winter[Raven]
2005-12-27, 13:40:13
With 48 shader units and 16 pipelines this card ought to be significantly faster than R520 and it's just a little bit more than three weeks away from a world wide launch.

Klingt ganz stak nach ATI - PR Abteilung ... ^^

deekey777
2005-12-27, 14:34:55
']Klingt ganz stak nach ATI - PR Abteilung ... ^^
Daß sich diese Aussage nicht auf Quake 2 bezieht, sondern auf Spiele wie FEAR&Co, ist dir aber klar?

Sunrise
2005-12-27, 15:06:14
']Klingt ganz stak nach ATI - PR Abteilung ... ^^Inwiefern ? Wenn du das Teil übersetzt, steht dort ein "sollte signifikant schneller sein" in Bezug auf die Leistung, zusammen mit der Launch-Geschichte also mehr als nur realistisch, wenn man bedenkt, dass mit R580 derzeit alles nach Plan läuft und vor Wochen bereits produktionsfähige R580-Wafer vom Band liefen.

Für eine Seite wie den Inquirer, ist diese "Schlagzeile" fast schon zu politisch korrekt und erstaunlich passiv, wenn ich bedenke, mit was sie sonst so um sich werfen.

reunion
2005-12-27, 15:24:17
According to some sources with knowledge of the matter, ATI Technologies received the first commercial batch of R580 wafers several weeks ago. Sources close to the company suggest that ATI will be able to supply enough code-named R580 VPUs to fulfill the demand towards them.



According to market sources, ATI is unlikely to price its R580-based products at unprecedented levels, e.g., the part will not cost $649, a suggested retail price for the GeForce 7800 GTX 512.


http://www.xbitlabs.com/news/video/display/20051226173157.html

Winter[Raven]
2005-12-27, 16:10:53
Daß sich diese Aussage nicht auf Quake 2 bezieht, sondern auf Spiele wie FEAR&Co, ist dir aber klar?

In meiner ersten Version des Posting, habe ich auf Fear angespielt, diesen habe ich gelöscht. Das es auf die kommenden Spiele ankommt sollte auch einem Kind klar sein ...! :P

@ Sunrise

mit den 3 Alus würde ATi in etwa die Leistung heutiger 7800 Chips erreichen, ich kann mir, einfach nicht sooooooooooooooooooo einen sigifikaten Speed vorstellen. Es ist aber sicher, dass ATI in Ihre Techdemos was einbauen werden, wo man den Unterschied sehen wird. In Spielen? Abwarten und Tee trinken. Nvidias Antwort kommt noch früh genung *ganz fies grinsen muss :biggrin: *

TheVizitor
2005-12-27, 16:35:19
Das stimmt. Die "Antwort" auf die XT1800Plus kommt noch dieses Frühjahr unter dem Namen GeForce 7900 GT/GTX.
Aber schon 1-2 Monate später will Ati die XT1900 (Plus) auf den Markt bringen, zu ähnlichen Bedingungen.

Allgemein meine ich: So eine Grafikkarte ist total unnütz, da die eigentliche Aktualität einer Grafikkarte 2-3 Jahre anhält, weil sich die Spielegrafik sich auch in diesem Zeitraum komplett erneuert.

Viz

Coda
2005-12-27, 18:51:51
']mit den 3 Alus würde ATi in etwa die Leistung heutiger 7800 Chips erreichenDie ALU-Leistung des R580 dürfte taktnormalisiert schon mindestens Faktor 1.5 eines G70 betragen, dazu kommen noch die nebenläufigen TMUs.

Imho wird das Ding zusammen mit dem sau schnellen dynamischen Verzweigen ein wahres Pixelshader-Monster. Nur schade dass ATi die TMUs nicht ebenso aufgebohrt hat seit R300 ;(

Winter[Raven]
2005-12-27, 18:56:39
Die ALU-Leistung des R580 dürfte taktnormalisiert schon mindestens Faktor 1.5 eines G70 betragen, dazu kommen noch die nebenläufigen TMUs.

Imho wird das Ding zusammen mit dem sau schnellen dynamischen Verzweigen ein wahres Pixelshader-Monster. Nur schade dass ATi die TMUs nicht ebenso aufgebohrt hat seit R300 ;(

Der Gegner für den R580 heißt nicht G70 ... :biggrin: oder anders gesagt, die 1.5x wird ATI brauchen.

sklave_gottes
2005-12-27, 19:18:38
für den g70 hat ja auch x 0,5 alu-leistung gereicht!(r520)

Coda
2005-12-27, 19:18:56
']Der Gegner für den R580 heißt nicht G70 ... :biggrin: oder anders gesagt, die 1.5x wird ATI brauchen.
Das ändert doch nichts an der Tatsache dass deine Aussage schlicht falsch war.

Winter[Raven]
2005-12-27, 19:20:08
für den g70 hat ja auch x 0,5 alu-leistung gereicht!(r520)

Ahja? Ich will jetzt bitte paar Shader-Benches sehen, und nicht irgendein lausiges Füllratespielchen ^^.

Coda
2005-12-27, 19:20:44
Wen interessieren denn bitte Shader-Benches *seufz*

reunion
2005-12-27, 19:26:46
G71 wird vielleicht (deutlich?) mehr TMUs haben, trotzdem kann er an einem 256-bit Bus maximal 8 64-bit Speicherbefehle pro Takt verarbeiten. Man sieht ja bereits jetzt an der "GTX 512", dass der Core kaum verfügbaren, und extrem höchgetakteten Speicher benötigt. Ein hypotetischer G71 mit 32 TMUs würde wohl regelrecht an der fehlenden Bandbreite verhungern. Caching und Nebenläufigkeit werden zunehmend wichtiger, und mit diesem nimmt die Bedeutung der nackten Füllrate ab. Man sollte nicht (nur) die Zahlen vergleichen, sondern "das Ganze" im Auge behalten.

seahawk
2005-12-27, 20:44:15
´Hier geht es um den R580 nicht um eine NV Antwort. Es gint assenweise Möglichkeiten was NV getan hat und was nicht. Darüber zu spekulieren ist gegenwärtig unsinnig.

paul.muad.dib
2005-12-27, 23:58:12
G71 wird vielleicht (deutlich?) mehr TMUs haben, trotzdem kann er an einem 256-bit Bus maximal 8 64-bit Speicherbefehle pro Takt verarbeiten. Man sieht ja bereits jetzt an der "GTX 512", dass der Core kaum verfügbaren, und extrem höchgetakteten Speicher benötigt. Ein hypotetischer G71 mit 32 TMUs würde wohl regelrecht an der fehlenden Bandbreite verhungern. Caching und Nebenläufigkeit werden zunehmend wichtiger, und mit diesem nimmt die Bedeutung der nackten Füllrate ab. Man sollte nicht (nur) die Zahlen vergleichen, sondern "das Ganze" im Auge behalten.


Inwiefern wäre der r580 hier im Vorteil?

Ailuros
2005-12-28, 10:33:19
Das Zitat von AiL belegt meine Aussage ja. Die ROPs können nur an 8 Pixeln gleichzeitig arbeiten. Und da sie das bis 4xMSAA können, gibt man 32c/64z an. Wenn mans so ausdrückt, kann jede R300 16c und 16z, jede R420 32c und 32z. NV3x/4x sind bisher AFAIK die einzigen Chips bei denen die Bezeichnung auch so hinkommen würde. Bsw kann ein NV40 wirklich 16c und 32z bearbeiten.

Solche Vergleiche sind zu gefaehrlich IMO da es sich beim Xenos um ein ganz anderes Kapitel handelt. Ohne dass wir jetzt zu lange in anderen Gebieten herumfuchteln, wo die ROPs liegen und wie hoch die Bandbreite zum eDRAM ist, ist schon seit langem bekannt.

Ailuros
2005-12-28, 10:47:12
G71 wird vielleicht (deutlich?) mehr TMUs haben, trotzdem kann er an einem 256-bit Bus maximal 8 64-bit Speicherbefehle pro Takt verarbeiten. Man sieht ja bereits jetzt an der "GTX 512", dass der Core kaum verfügbaren, und extrem höchgetakteten Speicher benötigt. Ein hypotetischer G71 mit 32 TMUs würde wohl regelrecht an der fehlenden Bandbreite verhungern. Caching und Nebenläufigkeit werden zunehmend wichtiger, und mit diesem nimmt die Bedeutung der nackten Füllrate ab. Man sollte nicht (nur) die Zahlen vergleichen, sondern "das Ganze" im Auge behalten.

Und ich dachte das Multitexturing Fuellrate weiterhin wichtig sein soll :biggrin:

Es gibt keine klare Antwort zum obrigen da es zu stark von einem jeglichen Fall abhaengt. Bei DX7.0 multitexturing Faellen wird sich vielleichts die hoehere Fuellrate einer theoretischen 32 TMU GPU schon ausspielen; bei DX9.0 Spielen kommt dann die arithmetische Leistung noch dazu, eben stets plus/minus wie jede GPU texture OPs dort behandelt.

Ailuros
2005-12-28, 11:06:27
Inwiefern wäre der r580 hier im Vorteil?

Angenommen es aendert sich nichts von R520 auf R580 und von G70 auf G7x@90nm, ausser die hoehere Anzahl der Einheiten:

G70@550MHz hat nur geringe Unterschiede zu R520 in sehr shaderlastigen Faellen mit AA/AF, weil:

a) R5xx texture OPs anders behandelt
b) Der Speichercontroller bei AA-Faellen eben um einiges hilft.

R580 hat jetzt aber 3x mal so hohe ALU Leistung, was wohl heissen koennte dass noAA/AF Leistung im Vergleich zu R520 um einiges hoeher sein sollte.

Fear 1600, noAA/AF:

GTX 512 = 64 fps
X1800XT = 51 fps

Fear 1600, 4xAA/16xAF:

GTX 512 = 35 fps (-45%)
X1800XT = 39 fps (-24%)

Rein spekulativ:

Fear noAA:

G7x@90nm = ~85 fps
R580 = ~80 fps

Fear 4xAA:

G7x@90nm = ~47 fps (-45%)
R580 = ~61 fps (-24%)

reunion
2005-12-28, 11:41:02
Inwiefern wäre der r580 hier im Vorteil?

Er hat AFAIK vollständig entkoppelte TMUs, und das Caching-System soll für einen erheblichen Teil der hohen Transistorenanzahl von R520 verantwortlich sein.

Und ich dachte das Multitexturing Fuellrate weiterhin wichtig sein soll :biggrin:


Ist sie auch, nur benötigt man auch die entsprechende Bandbreite dazu. :D

reunion
2005-12-28, 11:51:29
Rein spekulativ:

Fear noAA:

G7x@90nm = ~85 fps
R580 = ~80 fps

Fear 4xAA:

G7x@90nm = ~47 fps (-45%)
R580 = ~61 fps (-24%)


Das kannst du so nicht rechnen. Wenn ein Flaschenhals beseitigt wird, bedeutet dies zwangsläufig, dass andere Flaschenhälse bedeutender werden. Auf deine Beispiel bezogen: Ein Mitgrund, warum R520 nur so wenig Leistung mit AA/AF verliert, ist sicherlich, weil ohne AA/AF die Shaderfüllrate limitiert. Wenn man die Shaderfüllrate jetzt anhebt, steigt der prozentuelle Verlust durch AA/AF logischerweise an.

Ailuros
2005-12-28, 12:10:34
Es hat AFAIK vollständig entkoppelte TMUs, und das Caching-System soll für einen erheblichen Teil der hohen Transistorenanzahl von R520 verantwortlich sein.

Was heisst vollstaendig entkoppelt ueberhaupt? Nur so nebenbei aber diese sogenannte "Entkoppelung" - die uebrigens schon seit R3xx existiert - hat genauso Vor- als auch Nachteile, wobei auch gleiches fuer GeForces gilt.

Ist sie auch, nur benötigt man auch die entsprechende Bandbreite dazu. :D

Und Du brauchst genau wieviel Bandbreite fuer ein veraltetes DX7.0 Spiel? Komm mir jetzt bloss nicht mit single texturing Fuellraten; quad texturing + MSAA/AF.

Das kannst du so nicht rechnen. Wenn ein Flaschenhals beseitigt wird, bedeutet dies zwangsläufig, dass andere Flaschenhälse bedeutender werden. Oder anders ausgedrückt: R520 verliert vermutlich nur so wenig mit AA, da ohne AA die Shaderfüllrate limitiert. Wenn man die Shaderfüllrate jetzt anhebt, steigt der prozentuelle Verlust durch das AA logischerweise an.

Das soll jetzt Sinn machen? Natuerlich kann es sein dass meine rein spekulative Rechnung total daneben ist dank anderer Flaschenhaelse, aber was den Speichercontroller und MSAA betrifft sehe ich nicht ein warum sich hier viel mehr aendern sollte.

reunion
2005-12-28, 12:38:35
Was heisst vollstaendig entkoppelt ueberhaupt? Nur so nebenbei aber diese sogenannte "Entkoppelung" - die uebrigens schon seit R3xx existiert - hat genauso Vor- als auch Nachteile, wobei auch gleiches fuer GeForces gilt.

Werde mal konkret - was sind die Nachteile, außer eines höheren Transistorenverbrauches.


Und Du brauchst genau wieviel Bandbreite fuer ein veraltetes DX7.0 Spiel?


Und wieviel Füllrate brauchst du für ein veraltetes DX7.0 Spiel?


Das soll jetzt Sinn machen? Natuerlich kann es sein dass meine rein spekulative Rechnung total daneben ist dank anderer Flaschenhaelse, aber was den Speichercontroller und MSAA betrifft sehe ich nicht ein warum sich hier viel mehr aendern sollte.

Ja, das soll Sinn machen.

Ailuros
2005-12-28, 12:49:28
Werde mal konkret - was sind die Nachteile, außer eines höheren Transistorenverbrauches.

Wieso hoeherer Transistorenverbrauch? Beide Architekturen sind von Grund auf anders aufgebaut, zu solch einer Schlussfolgerung kommt man nicht so leicht ohne zu wissen wohin jeder Transistor genau verwendet wird.

Und wieviel Füllrate brauchst du für ein veraltetes DX7.0 Spiel?

Kommt ganz auf die Aufloesung an und was jeder damit anrichten will. Wuerdest nicht konstant nur das auskapseln was gerade die ATI PR Maschine nach aussen schmeisst, wuerdest Du auch gewisse Aspekte auch nicht so stark und einseitig generalisieren. UT2004 ist ein reines Dx7.0 Spiel; wie sich hier eine X1600 verhaelt kann man leicht sehen. Und ja natuerlich ist das Zeug Bloedsinn im Grund, da solche Spiele viel zu alt sind. Was hier eben daneben liegt ist die Generalisierung dass die zusaetzliche Fuellrate gar nichts bringen soll.

Ja, das soll Sinn machen.

Bon apetit :)

paul.muad.dib
2005-12-28, 12:54:27
Er hat AFAIK vollständig entkoppelte TMUs, und das Caching-System soll für einen erheblichen Teil der hohen Transistorenanzahl von R520 verantwortlich sein.


Schon klar, aber helf mir bitte den Bezug zur Speicherbandbreite herzustellen, an der der G72 verhungert und der r580 nicht.

seahawk
2005-12-28, 12:57:42
Ailruos was für einen G70@90nm nimmst Du als Grundlage für Deine "Rechnungen" ?

Den als G71 spekulierten oder den öfters mal G80 genannten ?

Ailuros
2005-12-28, 12:59:14
Ailruos was für einen G70@90nm nimmst Du als Grundlage für Deine "Rechnungen" ?

Den als G71 spekulierten oder den öfters mal G80 genannten ?

8 quads@=/>550MHz, 10VS

Ronny145
2005-12-28, 13:04:21
Optimiert Ati noch irgendwie den Verbrauch vom R580? Die X1800XT ist schon nicht so sparsam. Oder wird das eher noch mehr?

seahawk
2005-12-28, 13:18:41
8 quads@=/>550MHz, 10VS

Also 7800GTX 512MB + 33%. :D

Das würde ich ähnlcih erwarten. Witzigerweise, dürfte dies mit 4xMSAA nicht reichen. NV muss imho mehr machen.

Ailuros
2005-12-28, 13:23:45
Also 7800GTX 512MB + 33%. :D

Das würde ich ähnlcih erwarten. Witzigerweise, dürfte dies mit 4xMSAA nicht reichen. NV muss imho mehr machen.

Eben. ATI's Speichercontroller minimalisiert momentan den Verlust mit 4xAA viel zu stark, dass man hier ohne andere Aenderungen mithalten koennte.

nagus
2005-12-28, 13:35:24
http://www.hkepc.com/bbs/viewthread.php?tid=528266

reunion
2005-12-28, 13:38:15
Schon klar, aber helf mir bitte den Bezug zur Speicherbandbreite herzustellen, an der der G72 verhungert und der r580 nicht.


Weil R580 nur 16 TMUs, und damit deutlich weniger Texelfüllrate haben wird. Dazu einen besseren Speichercontroller, und ein ausgeklügeltes Cachingsystem.

Bei nVs-Design sind die TMUs nicht entkoppelt, so dass man nur ein komplettes Quad inklusive TMUs anhängen kann. Doch wenn die Bandbreite nicht da ist, nützen die zusätzlich TMUs nichts - sie blockieren sogar die gesamte Pipeline.

Gandharva
2005-12-28, 13:46:07
http://www.hkepc.com/bbs/viewthread.php?tid=528266also nix mit > 700mhz. war aber auch ziemlich klar. die XTX ist ja wohl eher ein scherzartikel wenn man mal die taktunterschiede zur XT betrachtet.

30A für die XTX und 38A für CF! :eek:

One's own ATi the R580 true body exposes Die Size to innovate again high ATi will be able officially to issue brand-new high step cartography core R580 to January 24, 2006, moreover also the official naming will be Radeon the X1900 series, although the hearsay long time but had not seen the true body, how but can the HKEPC editorial department be called the reader which pursues the new thing to be disappointed, one's own looks for ATi the R580 true body exposure, may see R580 Die Size further changed in a big way, if said by 90 奈 metric systems regulations, so huge Die Size believed will be able to integrate surpasses above 3.5 hundred million transistors. Now ATi not yet submits the R580 core to the merchant the official specification, only knew will be able to divide into 3 editions, most Gao Chieh will be Radeon X1900XTX, substitutes for old will have by the PE naming method, when the core the arteries is 650MHz, when the memory body the arteries will be 1550MHz. Radeon when X1900XT core the arteries are 625MHz, when the memory body the arteries are 1450MHz. But the CrossFire edition also can when the same date issue, the core the arteries are the 625MHz memory body are 1450MHz. Moreover, ATi discloses Radeon X1900XTX to the merchant the request least 450W power source supply, 30A 12V output, if is overhead construction X1900 CrossFire requests to use the 550W power source supply and 12V must provide 38A the output ability.

Ailuros
2005-12-28, 13:47:53
Weil R580 nur 16 TMUs, und damit deutlich weniger Füllrate haben wird. Dazu einen besseren Speichercontroller, und ein ausgeklügeltes Cachingsystem.

Bei nVs-Design sind die TMUs nicht entkoppelt, so dass man nur ein komplettes Quad inklusive TMUs anhängen kann. Doch wenn die Bandbreite für die TMUs nicht da ist, blöckieren die TMUs die gesamte Pipeline.

Nur das fettgedruckte macht Sinn; der Rest ist zusammengeraffter Quark.

reunion
2005-12-28, 13:48:23
Wieso hoeherer Transistorenverbrauch? Beide Architekturen sind von Grund auf anders aufgebaut, zu solch einer Schlussfolgerung kommt man nicht so leicht ohne zu wissen wohin jeder Transistor genau verwendet wird.


Du hast meine Frage nicht beantwortet, was ist der Nachteil von entkoppleten TMUs?

Ailuros
2005-12-28, 13:49:14
also nix mit > 700mhz. war aber auch ziemlich klar. die XTX ist ja wohl eher ein scherzartikel wenn man mal die taktunterschiede zur XT betrachtet.

30A für die XTX und 38A für CF! :eek:

650MHz fuer den Anfang machen auch Sinn, obwohl die Quelle fuer die Tonne ist.

Ailuros
2005-12-28, 13:51:36
Du hast meine Frage nicht beantwortet, was ist der Nachteil von entkoppleten TMUs?

Gilt genauso fuer Deine oeden Fragen: was heisst bei Dir entkoppelte TMUs ueberhaupt? Zum vorigen Quark deaktiviert ATI uebrigens auch mit jeglichem quad die dementsprechende TMUs.

Zu jeglicher anderer "Entkoppelung" die weiss der Geier was sie genau bedeuten soll erwarte ich erstmal eine Erklaerung.

reunion
2005-12-28, 13:58:03
Gilt genauso fuer Deine oeden Fragen: was heisst bei Dir entkoppelte TMUs ueberhaupt?


Was ist daran nicht zu verstehen?
Die TMUs sind entkoppelt, d.h. sie blockieren die Pipeline nicht.
Außerdem kann ATi - wie man an RV530 und R580 sieht - die ALU-Zahl unabhängig von den TMUs erhöhen. nV muss ein komplettes Quad inkl. TMUs anhängen, sofern man keine tieferen Einschnitt in die Pipeline vornimmt.


Zum vorigen Quark deaktiviert ATI uebrigens auch mit jeglichem quad die dementsprechende TMUs.


Ließ meine Beiträge bitte genau. Ich habe derartiges nie behauptet. Du reimst dir offensichtlich irgendwelche skurielen Dinge zusammen, ohne den Sinn des gequoteten zu verstehen.

Ailuros
2005-12-28, 14:02:39
Was ist daran nicht zu verstehen?
Die TMUs sind entkoppelt, d.h. sie blockieren die Pipeline nicht.

Dann bleibt es eben "Quark". Wieviele quads und wieviele TMUs hat eine X800GT genau?


Ließ meine Beiträge bitte genau. Ich habe derartiges nie behauptet. Du reimst dir offensichtlich irgendwelche skurielen Dinge zusammen, ohne den Sinn des gequoteten zu verstehen.

Eine bessere Ausrede vielleicht?

Um es mal anders anzunehmen, Radeons haben schon seit einer Ewigkeit getrennte texture address Prozessoren, warum diese jetzt sowohl Vor- als auch Nachteile haben koennte liegt im Bereich (jetzt mal verdammt vereinfacht) von general purpose und special function Einheiten.

reunion
2005-12-28, 14:08:05
Dann bleibt es eben "Quark". Wieviele quads und wieviele TMUs hat eine X800GT genau?


Schön, dann ist es für dich eben "Quark".
Und was du jetzt mit der X800GT willst, weiß ich wirklich nicht.


Eine bessere Ausrede vielleicht?


Ausrede ist gut.
Du schreibst irgendetwas von Quads deaktivieren, was ich in keinster Weise geschrieben habe.


Um es mal anders anzunehmen, Radeons haben schon seit einer Ewigkeit getrennte texture address Prozessoren, warum diese jetzt sowohl Vor- als auch Nachteile haben koennte liegt im Bereich (jetzt mal verdammt vereinfacht) von general purpose und special function Einheiten.

Ja, verdammt vereinfacht - "Quark" eben.

//Edit: Es hat wirklich keine Sinn, auf diese Weise weiter zu diskutieren. Einen schönen Tag noch.

Gandharva
2005-12-28, 14:23:08
650MHz fuer den Anfang machen auch Sinn, obwohl die Quelle fuer die Tonne ist.ist nun schon die 2te quelle mit diesen taktraten. zudem gibts angaben zur leistungsaufnahme UND bildchen X-D ! auf welche leistung würde die karte theoretisch kommen wenn man von 650/1550 ausgeht?

deekey777
2005-12-28, 14:46:07
Optimiert Ati noch irgendwie den Verbrauch vom R580? Die X1800XT ist schon nicht so sparsam. Oder wird das eher noch mehr?

Der Speicher ist sehr hungrig, der R520 auf der X1800XT verbraucht etwa die Hälfte des Gesamtverbrauchs:
http://www.ixbt.com/video2/r520-3.shtml.
Die Spannung liegt bei 1,35V, die Stromstärke bei höchstens 35A, es sind also höchstens 48W, die der Chip verbraucht.

(del)
2005-12-28, 14:50:26
Bald. Bald ;) klick (http://www.hardtecs4u.com/?id=1135699195,59157,ht4u.php)

Gandharva
2005-12-28, 14:52:44
Bald. Bald ;) klick (http://www.hardtecs4u.com/?id=1135699195,59157,ht4u.php)asbach! -> thread lesen! ;)

StefanV
2005-12-28, 14:53:33
Weil R580 nur 16 TMUs, und damit deutlich weniger Texelfüllrate haben wird. Dazu einen besseren Speichercontroller, und ein ausgeklügeltes Cachingsystem.

Bei nVs-Design sind die TMUs nicht entkoppelt, so dass man nur ein komplettes Quad inklusive TMUs anhängen kann. Doch wenn die Bandbreite nicht da ist, nützen die zusätzlich TMUs nichts - sie blockieren sogar die gesamte Pipeline.
Warum wird hier immer HirZ unterschlagen, das nV nicht nutzen kann/darf?! :devil:

Ailuros
2005-12-28, 14:55:10
Schön, dann ist es für dich eben "Quark".
Und was du jetzt mit der X800GT willst, weiß ich wirklich nicht.

Siehe weiter unten.

Ausrede ist gut.
Du schreibst irgendetwas von Quads deaktivieren, was ich in keinster Weise geschrieben habe.

Zitat von Dir:

Bei nVs-Design sind die TMUs nicht entkoppelt, so dass man nur ein komplettes Quad inklusive TMUs anhängen kann.

Ob man es jetzt "anhaengt" oder "deaktiviert" macht im gegebenen Fall keinen Unterschied. Wo immer angehaengt oder deaktiviert wird - und das egal ob ATI oder NVIDIA - ist es bis jetzt stets pro SIMD Kanal eine TMU. Derartige Entkoppelungs-Thesen verstehst Du nur selber.

Ja, verdammt vereinfacht - "Quark" eben.

//Edit: Es hat wirklich keine Sinn, auf diese Weise weiter zu diskutieren. Einen schönen Tag noch.

Na entkoppel dann einfach mal Deine persoenlichen Bevorzugungen von der Realitaet dann klappt es vielleicht schon.

Ailuros
2005-12-28, 14:57:50
Warum wird hier immer HirZ unterschlagen, das nV nicht nutzen kann/darf?! :devil:

Hierarchical Z koennte jeder IHV benutzen; natuerlich mit eigener Anwendungsart.

Ailuros
2005-12-28, 15:00:16
ist nun schon die 2te quelle mit diesen taktraten. zudem gibts angaben zur leistungsaufnahme UND bildchen X-D ! auf welche leistung würde die karte theoretisch kommen wenn man von 650/1550 ausgeht?

Froehliche Bildchen hat HKEPC schon immer zum vorzeigen gehabt; auch damals als sie absolut sicher waren dass R520 eben 6 quads hat und dank schlechten yields nur mit 4 angekommen ist. Eine Quelle wuerde ich das Ding nichtmal bezeichnen.

Leistung? In sehr shaderlastigen Faellen schaetzungsweise etwa 50% schneller als R520.

(del)
2005-12-28, 15:06:49
asbach! -> thread lesen! ;)
Spinnst Du? ;) Die Nachricht ist von gestern :D

Was ist nun mit dem ENTKOPPELN? Ich glaub beide Jungs wissen nicht genau was Sache ist und spielen den Ball sofort wieder ab. Oder wie? ;)

"enkoppelt" "was heißt das?" "ja das eben" "ja das ist quark" "ja warum?" "ja darum eben". Heee? :lol:

Als Nichtsahnender =) bitte ich um Aufklärung. Ich sehe das so, daß die TMUs vor den ALUs liegen und solange sie am chackern sind, die ALUs nichts machen können. Ist das auch umgekehrt so? D.h. solange die ALU voll bussy ist, kann die TMU nicht an ihre Aufgaben ran? Wird das alles in einer Art Rutsch abgearbeitet wo diese Reihenfolge eingehalten werden muß? 'Erst ich, dann Du, wenn Du fertig dann wieder ich'? Hätte noch 2-3 Fragen, aber erstmal gucken, ob ich das richtig gepeilt habe ;)

deekey777
2005-12-28, 15:17:34
Koppeln-Entkoppeln, kauft-verkauft...
:P
Auf den ersten 5-6 Seiten steht einiges zum Thema. :biggrin:

(del)
2005-12-28, 15:22:27
Koppeln-Enkoppeln, kauft-verkauft...

Auf den ersten 5-6 Seiten steht einiges zum Thema. :biggrin:
ENKoppeln? Ah ja. Hmm. Und was diskutieren die JETZT NOCH so unwissend darüber? :|

mpV
2005-12-28, 16:15:17
Gibt es eigentlich halbwegs seriöse Schätzungen zur Komplexität es R580? Irgendwo wurde in diesem Thread mal etwas von rund 380 Mio. Transistoren gesagt (Auch Ailuros geht hier (http://www.forum-3dcenter.org/vbulletin/showpost.php?p=3776115&postcount=44) davon aus), aber das scheint mir ziemlich niedrig gegriffen zu sein.

mapel110
2005-12-28, 16:19:27
Gibt es eigentlich halbwegs seriöse Schätzungen zur Komplexität es R580? Irgendwo wurde in diesem Thread mal etwas von rund 380 Mio. Transistoren gesagt (Auch Ailuros geht hier (http://www.forum-3dcenter.org/vbulletin/showpost.php?p=3776115&postcount=44) davon aus), aber das scheint mir ziemlich niedrig gegriffen zu sein.
Da R580 auch nur 16 TMUs/Pipes haben wird, ist die Schätzung wohl nicht verkehrt, leicht aufgebohrt eben mit Detailverbesserungen.
Ein neues Transistormonster kommt dann wohl erst im zweiten Halbjahr 06.

Ailuros
2005-12-28, 16:22:33
~380M waere das geschaetzte Minimum. Der naechste Schub an GPUs koennte auch die 400M erreichen (auch fuer G7x@90nm; NV40-->G70= 222M-->302M). Viel hoeher als 400 scheint mir eher als unwahrscheinlich.

reunion
2005-12-28, 16:40:09
Ob man es jetzt "anhaengt" oder "deaktiviert" macht im gegebenen Fall keinen Unterschied. Wo immer angehaengt oder deaktiviert wird - und das egal ob ATI oder NVIDIA - ist es bis jetzt stets pro SIMD Kanal eine TMU. Derartige Entkoppelungs-Thesen verstehst Du nur selber.


ATi hat bei der R5xx-Serie bis jetzt noch überhaupt nichts deaktiviert.
Es wurden bei RV530, sowie bei R580 und vermutlich auch bei RV560 die Shaderprozessoren verdreifacht, die TMU Anzahl blieb unverändert.

Ich weiß sowieso nicht, was du willst, aus den ATi-Diagrammen geht IMHO klar hervon, dass die TMUs unabhängig von den Shader-Cores sind:

http://www.hardtecs4u.com/images/reviews/2005/asus_eax1800xt/x1800arch.png

http://www.hardtecs4u.com/reviews/2005/asus_eax1800xt/index2.php


Na entkoppel dann einfach mal Deine persoenlichen Bevorzugungen von der Realitaet dann klappt es vielleicht schon.

Deine persöhnlichen Stichelein kannst du behalten.

Demirug
2005-12-28, 16:42:23
reunion, das ist ein Marketing Diagramm.

SKYNET
2005-12-28, 16:43:09
~380M waere das geschaetzte Minimum. Der naechste Schub an GPUs koennte auch die 400M erreichen (auch fuer G7x@90nm; NV40-->G70= 222M-->302M). Viel hoeher als 400 scheint mir eher als unwahrscheinlich.


ich spekuliere mal auf 450.000.000 beim G80! ;)

reunion
2005-12-28, 16:49:01
Als Nichtsahnender =) bitte ich um Aufklärung. Ich sehe das so, daß die TMUs vor den ALUs liegen und solange sie am chackern sind, die ALUs nichts machen können. Ist das auch umgekehrt so? D.h. solange die ALU voll bussy ist, kann die TMU nicht an ihre Aufgaben ran? Wird das alles in einer Art Rutsch abgearbeitet wo diese Reihenfolge eingehalten werden muß? 'Erst ich, dann Du, wenn Du fertig dann wieder ich'? Hätte noch 2-3 Fragen, aber erstmal gucken, ob ich das richtig gepeilt habe ;)

Wenn die TMUs nicht "nebenläufig" sind, kann die gesamte Pipeline von den TMUs blockiert werden. Bei 16x AF kann das bis zu 32 Takte und mehr ausmachen. Das ist bei nVs aktuellem Design der Fall.

Dies ist natürlich nicht möglich, wenn die TMUs "nebenläufig", oder gar "entkoppelt" sind. Dann können die ALUs auch weiterhin arbeiten, ohne von den TMUs aufgehalten zu werden.

sklave_gottes
2005-12-28, 16:51:09
Leistung? In sehr shaderlastigen Faellen schaetzungsweise etwa 50% schneller als R520.

wird in so einem fall viel höher liegen,und meiner meinung nach fast doppelt so schnell sein.

reunion
2005-12-28, 16:51:13
reunion, das ist ein Marketing Diagramm.

Was anderes gibts nunmal nicht. Man kanns glauben, man kann aber natürlich auch alles hinterfragen. Ich wüsste jedenfalls nicht, warum man hier bewusst Blödsinn reinschreiben sollte.

Coda
2005-12-28, 16:52:21
Solange ATI keine Tools anbietet die die genaue Taktzahl von Shadern angibt wie nVIDIA kannst du solche pauschalisierten Aussagen gar nicht treffen. Es kann durchaus sein, dass es auch bei ATI zu Stalls kommt wenn Resourcen ausgehen.

paul.muad.dib
2005-12-28, 16:54:02
Weil R580 nur 16 TMUs, und damit deutlich weniger Texelfüllrate haben wird. Dazu einen besseren Speichercontroller, und ein ausgeklügeltes Cachingsystem.

Bei nVs-Design sind die TMUs nicht entkoppelt, so dass man nur ein komplettes Quad inklusive TMUs anhängen kann. Doch wenn die Bandbreite nicht da ist, nützen die zusätzlich TMUs nichts - sie blockieren sogar die gesamte Pipeline.

also, das heißt, wenn die TMUs nichts zu tun haben, arbeiten die ALUs auch nicht?

Ailuros
2005-12-28, 16:55:08
ATi hat bei der R5xx-Serie bis jetzt noch überhaupt nichts deaktiviert.

Falls es nie der Fall sein wird, spricht es nicht unbedingt zum Vorteil der Architektur. Erscheint aber eher unwahrscheinlich da zu viel von der R3xx/4xx Aera geerbt wurde.

Ich weiß sowieso nicht, was du willst, aus den ATi-Diagrammen geht IMHO klar hervon, dass die TMUs unabhängig von den Shader-Cores sind:

Wie Demi schon sagte handelt es sich um Marketing-Geblubber. Wenn Du aber schon mit dem Zeug spielen willst, erklaer mir erstmal warum der texture-address Prozessor immer noch im gleichen Quadrat liegt wie die quads.

Coda
2005-12-28, 16:55:57
also, das heißt, wenn die TMUs nichts zu tun haben, arbeiten die ALUs auch nicht?Nein. Außerdem ist das grober Unfug was hier verzapft wird.

Wenn man den Texture-Cache entsprechend aufbohrt ist auch für 32TMUs immer alles im grünen Bereich.

reunion
2005-12-28, 16:56:24
also, das heißt, wenn die TMUs nichts zu tun haben, arbeiten die ALUs auch nicht?

Nein, wenn die TMUs zu viel zu tun haben, müssen die ALUs warten.

Ailuros
2005-12-28, 16:56:54
Was anderes gibts nunmal nicht. Man kanns glauben, man kann aber natürlich auch alles hinterfragen. Ich wüsste jedenfalls nicht, warum man hier bewusst Blödsinn reinschreiben sollte.

Nach ATI's Diagrammen koennte ich auch auf viel mehr als eine ALU pro SIMD Kanal in R3xx/4xx/5xx zaehlen.

***edit:

*hust*

Texture processing is achieved in a similar fashion to ATI's previous parts. Although the earlier pipeline diagram indicates a texture sampler array, all the texture units are not re-allocatable to different pipelines, instead 4 are dedicated to each of the quads.

http://www.beyond3d.com/reviews/ati/r520/index.php?p=03

mpV
2005-12-28, 16:59:39
~380M waere das geschaetzte Minimum. Der naechste Schub an GPUs koennte auch die 400M erreichen (auch fuer G7x@90nm; NV40-->G70= 222M-->302M). Viel hoeher als 400 scheint mir eher als unwahrscheinlich.Ich habe gerade mal selbst grob überschlagen und dabei die Eckdaten aus dem CBase- Artikel (http://www.computerbase.de/artikel/hardware/grafikkarten/2005/test_ati_radeon_x1800_x1600_x1300/2/) zu den R5XXern zu Grunde gelegt.

Wenn man als Hauptunterschied von R580 und R520 die dreifache Anzahl an Pixelshading- Units (nenne ich im Folgenden PSUs) annimmt, bietet sich ein Vergleich mit der Differenz zwischen RV530 und RV515 an. Ersterer verfügt über 12 statt 4 PSUs und 5 statt 2 VPs (Ist das wirklich alles, oder habe ich relevante Unterschiede übersehen?). Das ergibt einen Zuwachs von etwa 52 Mio. Transistoren.

Eim R580 kämen nun 32 weitere PSUs hinzu, aber keine oder nur wenige weitere VPs. Ich würde jetzt vermuten, dass eine VP weniger komplex ist als eine PSU (aus der arithmetischen Leistung heraus. 1 vec4 + 1 sca vs. 2 vec3 2 sca). Vielleicht kann das ja jemand genauer sagen; ich nehme jdenfalls erst einmal den gleichen Transitorbedarf für eine PSU und eine VP an.

Dann ergibt sich für die 32 zusätzlichen PSUs des R580 ein kanpp dreimal so großer Transistorbedarf wie für die zusätzlichen 8 PSUs + 3 VPs des RV530, also ungefähr 150 Mio. Das Ergebnis wären grob 470 Mio. Transistoren beim R580.

Kann das so denn stimmen? Ich kann mir eigentlich nicht vorstellen, dass ATI bei einer solchen Komplexitätssteigerung unter Verwendung des selben Fertigungsprozesses innerhalb weniger Monate den Takt auch nur würde halten können, geschweige denn, ihn auch noch steigern.

deekey777
2005-12-28, 17:03:12
Die X1600 hat auch einen komplizierteren Memorycontroller im Vergleich zur X1300, was weitere Transistoren kostet.

(del)
2005-12-28, 17:43:09
Dann ergibt sich für die 32 zusätzlichen PSUs des R580 ein kanpp dreimal so großer Transistorbedarf wie für die zusätzlichen 8 PSUs + 3 VPs des RV530, also ungefähr 150 Mio. Das Ergebnis wären grob 470 Mio. Transistoren beim R580.

Kann das so denn stimmen? Ich kann mir eigentlich nicht vorstellen, dass ATI bei einer solchen Komplexitätssteigerung unter Verwendung des selben Fertigungsprozesses innerhalb weniger Monate den Takt auch nur würde halten können, geschweige denn, ihn auch noch steigern.
Muß man halt abwarten ;) Angeblich sind die ganzen Probs mit dem R5x0 darauf zurückzuführen, daß sie 2-3 "Böcke" im Design hatten und sich danach totgesucht haben. Dann ging auf 1x jemanden endlich das Licht auf und es ging alles. Nur die Zeit war schon so knapp, daß der 520 raus mußte. Wer weiß, ob wirklich alles dann verbessert wurde oder nur das Nötigste. Aus der Not heraus, weil beim G70 wohl alles wie geplant ablief und man nicht mehr länger warten konnte.

Es ist also nicht auszuschliessen. Der 520 zeigt noch nicht was für Potenzial in dem R5x0 steckt. Deswegen heißt es auch nicht X1850 :D ;)

mpV
2005-12-28, 18:01:22
Ich halte das mit dem Geistesblitz für bestenfalls mäßig glaubwürdig. Der R520 wurde vorher ja reichlich verschoben; warum sollte man ihn dann gerade in dem Moment, in dem eine Lösung greifbar nahe ist, auf Gedeih und Verderb in die Produktion schicken?

Aber du hast recht, natürlich können wir Gewissheit nur durch Abwarten bekommen.

Die X1600 hat auch einen komplizierteren Memorycontroller im Vergleich zur X1300, was weitere Transistoren kostet.Ist eine Schätzung möglich, wieviel das ausmacht (Worin liegen da eigentlich die Unterschiede?)?

(del)
2005-12-28, 18:07:57
Ich halte das mit dem Geistesblitz für bestenfalls mäßig glaubwürdig. Der R520 wurde vorher ja reichlich verschoben; warum sollte man ihn dann gerade in dem Moment, in dem eine Lösung greifbar nahe ist, auf Gedeih und Verderb in die Produktion schicken?
Muß ja nicht gleich Geistesblitz sein. Punkt für Punkt und auf 1x hatten sie es vor den augen. Angeblich. Die Lösung des Taktproblems hat man ja noch realisiert. So, daß man mit dem G70 gut mithalten kann. Aber nochmals um 3 Wochen konnte man den R520 imho nicht verschieben. War schon eh sehr sehr spät.

Richtig. Wir wissen beide nicht, was möglich ist, wenn man auf dem Die nochmals richtig aufräumt. Langweilig wird uns wohl nicht :)

Ailuros
2005-12-28, 18:33:19
Bei den meisten chips sind nach mehreren Revisionen hoehere Frequenzen moeglich.

Selbst wenn die These die den R520 und seine Taktbarkeit betrifft stimmen sollte, war es ausserhalb des Raums aller Moeglichkeiten; es haette nur dessen Lebenszeit zu viel verkuerzt was wohl keinen Sinn mehr gemacht haette.

So oder so ist der R520 eine sehr gute Loesung. Dieses alberne Ultra-high end Spielchen zwischen den beiden IHVs koennte endlich ein Ende nehmen; es ist so nutzlos dass es schon seit langem laecherlich geworden ist. Natuerlich haben sich beide dieses Sueppchen selber eingebrockt, also muessen sie es auch selber ausschaufeln. IMHO ist es aber nur Resourcen-Verschwendung.

HAL-10K
2005-12-28, 20:46:12
Bei den meisten chips sind nach mehreren Revisionen hoehere Frequenzen moeglich.

Selbst wenn die These die den R520 und seine Taktbarkeit betrifft stimmen sollte, war es ausserhalb des Raums aller Moeglichkeiten; es haette nur dessen Lebenszeit zu viel verkuerzt was wohl keinen Sinn mehr gemacht haette.

So oder so ist der R520 eine sehr gute Loesung. Dieses alberne Ultra-high end Spielchen zwischen den beiden IHVs koennte endlich ein Ende nehmen; es ist so nutzlos dass es schon seit langem laecherlich geworden ist. Natuerlich haben sich beide dieses Sueppchen selber eingebrockt, also muessen sie es auch selber ausschaufeln. IMHO ist es aber nur Resourcen-Verschwendung.Ja klar. Die Industrie ist zu doof, und du, sowie all die Spekulationshelden hier haben den Überblick. Ist doch logisch!

Echt lustig zuzuschaun wie Leute endlos über irgendwelche zukünftige Spezifikationen labern und neunmalklug darüber schwatzen was Firma XYZ wie machen könnte und sollte, obwohl sie nur Grafikkarten kaufen um ihre Spiele zu zocken.

Tzzzz...

up¦²
2005-12-28, 20:58:06
http://www.hkepc.com/bbs/attachments_dir/ext_jpg/r580-1_LGn20UmqToIL.jpg

http://www.hkepc.com/bbs/attachments_dir/ext_jpg/r580-2_8jjvaoZmRhcc.jpg

Now ATi not yet submits the R580 core to the merchant the official specification, only knew will be able to divide into 3 editions, most Gao Chieh will be Radeon X1900XTX, substitutes for old will have by the PE naming method, when the core the arteries is 650MHz, when the memory body the arteries will be 1550MHz. Radeon when X1900XT core the arteries are 625MHz, when the memory body the arteries are 1450MHz. But the CrossFire edition also can when the same date issue, the core the arteries are the 625MHz memory body are 1450MHz. Moreover, ATi discloses Radeon X1900XTX to the merchant the request least 450W power source supply, 30A 12V output, if is overhead construction X1900 CrossFire requests to use the 550W power source supply and 12V must provide 38A the output ability.

http://www.hkepc.com/bbs/viewthread.php?tid=528266

38A :eek: :uexplode:

Gandharva
2005-12-28, 21:01:25
[snip]
38A :eek: :uexplode:irgendwie pennst du zur zeit! ;)

http://www.forum-3dcenter.org/vbulletin/showthread.php?p=3821251#post3821251

up¦²
2005-12-28, 21:14:27
Sorry :redface:
nagus wird sich gefreut haben!

reunion
2005-12-28, 21:17:06
Nach ATI's Diagrammen koennte ich auch auf viel mehr als eine ALU pro SIMD Kanal in R3xx/4xx/5xx zaehlen.


Natürlich sind solche Informationen mit Vorsicht zu genießen, nur solange keiner etwas anderes beweisen kann, muss man eben das glauben, was man hat.



***edit:

*hust*



http://www.beyond3d.com/reviews/ati/r520/index.php?p=03

Okay, wenn das stimmt, sind die TMUs nicht vollständig entkoppelt.

reunion
2005-12-28, 21:19:50
Hier ein Größenvergleich:

http://www.xbitlabs.com/images/news/2005-12/r520vsr580.jpg

http://www.xbitlabs.com/images/news/2005-12/r520vsr580_sm.jpg

http://www.xbitlabs.com/news/video/display/20051227220826.html

Avalox
2005-12-28, 21:24:43
Computerbase zeigt auch die Bilder des R580

Dabei ist auch eine Takttabelle.


Karte GPU-Takt RAM-Takt
X1900 XTX 650 MHz 1,55 GHz
X1900 XT 625 MHz 1,45 GHz
X1900 CrossFire 625 MHz 1,45 GHz


http://www.computerbase.de/news/hardware/grafikkarten/ati/2005/dezember/erste_bilder_atis_r580/

Coda
2005-12-28, 21:27:51
Soviel zu "mehr Takt" *hust*

deekey777
2005-12-28, 21:32:51
Soviel zu "mehr Takt" *hust*

Schon vergessen, daß genau diese Website bis zum letzten behauptet hat, daß der R520 32Pipelines hätte, von denen 16 deaktiviert werden, damit die Ausbeute hoch ist und nach und nach, wenn die Fertigung verbessert wurde, weitere Quads freigeschaltet werden...

reunion
2005-12-28, 21:35:03
Soviel zu "mehr Takt" *hust*


Abwarten.
Für mich macht eine "XTX" mit lächerlichen 4% mehr Takt als bei der "XT"-Version jedenfalls keinen Sinn.

Coda
2005-12-28, 21:37:52
Schon vergessen, daß genau diese Website bis zum letzten behauptet hat, daß der R520 32Pipelines hätte, von denen 16 deaktiviert werden, damit die Ausbeute hoch ist und nach und nach, wenn die Fertigung verbessert wurde, weitere Quads freigeschaltet werden...Das hat im Gegensatz zu dem hier aber auch keinen Sinn gemacht ;)

dildo4u
2005-12-28, 21:39:25
Für mich macht eine X1900XTX nur sinn wenn sie als einzige 24Pipes hat wobei dafür der Ramtakt zu mickrig ist wenn man ernsthaft die 7800GTX 512mb mit ihren 55GB Speicherbandbreite angreifen will.

deekey777
2005-12-28, 21:41:02
Das hat im Gegensatz zu dem hier aber auch keinen Sinn gemacht ;)

Doch blind sollte niemand diesen Infos trauen, auch wenn die 650MHz bei der Masse an Transistoren sehr wahrscheinlich klingen.

Für mich macht eine X1900XTX nur sinn wenn sie als einzige 24Pipes hat wobei dafür der Ramtakt zu mickrig ist wenn man ernsthaft die 7800GTX 512mb mit ihren 55GB Speicherbandbreite angreifen will.

Ich tippe darauf, daß du auch 24 TMUs meinst, doch man braucht die nicht (unbedingt), wenn die aktuellen und die kommenden Spiele eher Pixelshader-limitiert sind.

Ailuros
2005-12-29, 01:11:10
Ja klar. Die Industrie ist zu doof, und du, sowie all die Spekulationshelden hier haben den Überblick. Ist doch logisch!

Echt lustig zuzuschaun wie Leute endlos über irgendwelche zukünftige Spezifikationen labern und neunmalklug darüber schwatzen was Firma XYZ wie machen könnte und sollte, obwohl sie nur Grafikkarten kaufen um ihre Spiele zu zocken.

Tzzzz...

Dann wende Dich bitte auch nur an Leute die nur GPUs um Spiele zu zocken kaufen.

Ailuros
2005-12-29, 01:13:02
Hier ein Größenvergleich:

http://www.xbitlabs.com/images/news/2005-12/r520vsr580.jpg

http://www.xbitlabs.com/images/news/2005-12/r520vsr580_sm.jpg

http://www.xbitlabs.com/news/video/display/20051227220826.html


Dann stimmen wohl auch die bisherigen Schaetzungen die ueber ca. 20% mehr die space reden und ~390M Transistoren.

deekey777
2005-12-29, 01:22:41
Irgendwo stand, daß der R520 noch viel Ballast mit sich tragen muß: ob auch der R580 auch diesen Ballast noch hat?

Sunrise
2005-12-29, 01:49:23
Gibt es eigentlich halbwegs seriöse Schätzungen zur Komplexität es R580? Irgendwo wurde in diesem Thread mal etwas von rund 380 Mio. Transistoren gesagt (Auch Ailuros geht hier (http://www.forum-3dcenter.org/vbulletin/showpost.php?p=3776115&postcount=44) davon aus), aber das scheint mir ziemlich niedrig gegriffen zu sein.Diese Schätzung (die übrigens urspünglich von mir stammt (http://www.forum-3dcenter.org/vbulletin/showthread.php?p=3567003&highlight=380#post3567003)) war nur eine Annahme von mir, nachdem ich mal mit ein paar Zahlen herumgerechnet hatte.

Transistoren-Rechnungen oder Schätzungen sind immer sehr gewagt, denn einfach nur anhand der Fläche und/oder bei verschiedenen Designs eine plumpe mathematische Rechnung anzufertigen ist grundsätzlich auch nicht 100%ig korrekt durchzuführen, aber es sollte zumindest einen halbwegs realistischen Ansatz geben. Wobei selbst das nicht gewährleistet ist, wenn man davon ausgeht, dass R580 wirklich ein komplett anderer Chip ist, der nur gewisse Teile des R520-Designs übernimmt (und man eher RV530 als bessere Ausgangsbasis zur Schätzung zu Rate ziehen sollte).

Wie Ailuros bereits richtig gesagt hatte, es war "für mich" eine Basis, bei der ich vom denkbaren, ungefähren Minimum ausgegangen bin.

Sehr spekulativ eben. ;)

Sunrise
2005-12-29, 02:20:45
Irgendwo stand, daß der R520 noch viel Ballast mit sich tragen muß: ob auch der R580 auch diesen Ballast noch hat?Das hielt und halte ich schon immer für eine sehr gewagte und absolut unlogische Behauptung, die etwa auf einer Stufe mit den Spekulationen (die von HKEPC stammten) um die sicheren *hust* 6 Quads im R520, die nachträglich deaktiviert werden/wurden um gute Yields zu gewährleisten, liegen.

Besonders da R520 durch mehrere Revisionen gehen musste und dieser erst Monate später wirklich marktreif war (die Veränderungen der Metalllagen bei -14FG und -15FG mal komplett ausgenommen) wäre es auch absolut unlogisch (gerade auch mit Hinblick auf R580, dessen parallele Entwicklung mit R520 und dessen geplantem Erscheinungstermin) davon auszugehen, dass ATi eine große Zukunft jenseits von 4 Quads mit diesem Design geplant hatte.

Falls diese "Quelle" ursprünglich Redundanz meinte, könnte man sich auf diesen Begriff einigen, wobei ich dann wiederum nicht sehe, welchen Sinn es macht, besonders darauf hinzuweisen, da Redundanz immer eine gewisse Rolle im Chipdesign spielt.

HAL-10K
2005-12-29, 03:57:14
Dann wende Dich bitte auch nur an Leute die nur GPUs um Spiele zu zocken kaufen.Komplexität des Grafikkernes, Fertigungstechnik, Entwicklungs- und Produktionsaufwand, usw. - über so etwas sich auch nur im Entferntesten einer besseren Einschätzung als die Hersteller zu suggerieren ist Schwachsinn hoch drei!

Und ganz nebenbei, selbst als professioneller Softwareentwickler der diese Hardware nutzt kann nur in den seltensten Fällen tatsächlich etwas sinnvolles mit dem Spekulieren über die Interna der zukünftigen Architektur anfangen.

Mumins
2005-12-29, 06:42:21
Komplexität des Grafikkernes, Fertigungstechnik, Entwicklungs- und Produktionsaufwand, usw. - über so etwas sich auch nur im Entferntesten einer besseren Einschätzung als die Hersteller zu suggerieren ist Schwachsinn hoch drei!

Und ganz nebenbei, selbst als professioneller Softwareentwickler der diese Hardware nutzt kann nur in den seltensten Fällen tatsächlich etwas sinnvolles mit dem Spekulieren über die Interna der zukünftigen Architektur anfangen.

Hier sind durchaus Leute unterwegs, die in Kontakt mit den 2 großen stehen.

Ailuros
2005-12-29, 10:25:55
Komplexität des Grafikkernes, Fertigungstechnik, Entwicklungs- und Produktionsaufwand, usw. - über so etwas sich auch nur im Entferntesten einer besseren Einschätzung als die Hersteller zu suggerieren ist Schwachsinn hoch drei!

Es gibt genug Fakten und Analysen zu jedem Aspekt eines jeglichen existierendes Produktes. Damit diese Analysen erstmal entstehen nimmt jeglicher Author die paar Brocken die ihm jeder Hersteller zuwirft und versucht dann das Produkt so gut wie moeglich zu analysieren.

Und ganz nebenbei, selbst als professioneller Softwareentwickler der diese Hardware nutzt kann nur in den seltensten Fällen tatsächlich etwas sinnvolles mit dem Spekulieren über die Interna der zukünftigen Architektur anfangen.

Dann ist eben dieses Forum redundant und Du vielleicht fehl am Platz. Ich hab zwar nicht im geringsten etwas gegen Kritik, aber diese sollte zumindest aufbauend sein.

Wie dem auch sei das Grund-Konzept der Demokratie ist bekannt und es gibt nichts das mich davon aufhalten wird weiterhin meine Meinung so auszudruecken wie es mir passt.

-error-
2005-12-29, 14:38:45
Also wird die R580 in shaderlastigen Applikationen deutlich schneller sein, als die R520 und die G70?

Bei der Rohperformance wird sich aber nicht viel tun, oder?

mapel110
2005-12-29, 14:48:23
Also wird die R580 in shaderlastigen Applikationen deutlich schneller sein, als die R520 und die G70?

sollte man von ausgehen.

Bei der Rohperformance wird sich aber nicht viel tun, oder?
Es kommt mittlerweile sowieso sehr stark auf den verbauten Speicher an und da wirds keine besonderen Sprünge geben.

-error-
2005-12-29, 14:52:02
Ich dachte man wollte GDDR4 mit 1 Ghz Speichertakt einsetzen.

2006 soll ja Speicher kommen, der einen Realtakt von 1.2 Ghz ermöglicht, also 2.4 Ghz effektiv.

Limitiert eigendlich bei so einer Bandbreite nicht das Speicherinterface von 256 Bit?

ShadowXX
2005-12-29, 14:59:36
sollte man von ausgehen.


"Deutlich" sehe ich noch nicht so.....der r580 wird wohl 48 Shader-Units haben, der G70 hat schon 48 Shader-Units (und kann trotzdem nicht so viel gegenüber einem r520 reissen).

Das ganze wird sich natürlich verändern, je Shaderlastiger das ganze wird.

Das der r580 wohl schneller als ein G70 / r520 sein wird, ist wohl klar, aber ich erwarte keine Quantensprünge, auch nicht in shaderlastigen Games.

Mal sehen wie viele Shader-Units nV dagegensetzten wird (ich persönlich rechne für den G70 Nachfolger immer noch mit einen oder zwei weiteren "rangepappten" Quads....dann hätte der G80(?) im extremfall schon 64 Shader Units).

[dzp]Viper
2005-12-29, 15:02:23
der G70 hat schon 48 Shader-Units (und kann trotzdem nicht so viel gegenüber einem r520 reissen).


vielleicht weil die Shader-units beim G70 einfach nicht so gut sind? (bitte nicht hauen - bin technik-noob :D )

ShadowXX
2005-12-29, 15:02:28
Ich dachte man wollte GDDR4 mit 1 Ghz Speichertakt einsetzen.

2006 soll ja Speicher kommen, der einen Realtakt von 1.2 Ghz ermöglicht, also 2.4 Ghz effektiv.

Limitiert eigendlich bei so einer Bandbreite nicht das Speicherinterface von 256 Bit?

Du hast ja nur 2 möglichkeiten...Interface breiter oder mehr Takt. Momentan scheinen Sie sich auf "mehr Takt" eingeschossen zu haben.

Und der Effekt (also breiteres Interaface oder mehr Takt) ist ja im Endeffekt der gleiche.

Beides zusammen wäre natürlich ideal, aber wohl utopisch.

ShadowXX
2005-12-29, 15:06:41
Viper']vielleicht weil die Shader-units beim G70 einfach nicht so gut sind? (bitte nicht hauen - bin technik-noob :D )

Wenn man reine theoretische Shaderspeedmessungen macht (abgesehen von Branching-Sachen, da hat ATI schon was ganz gutes geleistet), ist der G70 schon ein ganzes Stück schneller als der r520.

Aber ich gebe dir recht, dass der G70 diesen Speed in Games scheinbar nicht auf den Boden bekommt (der "Grip" fehlt irgendwie).

Ob das jetzt an den Game-Devs oder am G70 Design liegt, könnte wohl höchstens Demi näher erleutern.

-error-
2005-12-29, 15:25:05
Du hast ja nur 2 möglichkeiten...Interface breiter oder mehr Takt. Momentan scheinen Sie sich auf "mehr Takt" eingeschossen zu haben.

Und der Effekt (also breiteres Interaface oder mehr Takt) ist ja im Endeffekt der gleiche.

Beides zusammen wäre natürlich ideal, aber wohl utopisch.

Warum ist beides utoptisch? Zu teuer? Bei HighEnd kommts auf den Preis doch eh nicht so an, wenn die Leistung dafür gut ist, siehe 7800 GTX 512 MB.

deekey777
2005-12-29, 15:34:26
Man kann die 48 ALUs einer 7800 nicht (direkt) mit den 48 ALUs einer R580 vergleichen.

Interessant: http://www.rage3d.com/board/showpost.php?p=1334076630&postcount=16

misterh
2005-12-29, 15:52:25
Man kann die 48 ALUs einer 7800 nicht (direkt) mit den 48 ALUs einer R580 vergleichen.

Interessant: http://www.rage3d.com/board/showpost.php?p=1334076630&postcount=16


7800GT/X haben keinen 48xALUs

nur 24xALUs

deekey777
2005-12-29, 15:58:18
7800GT/X haben keinen 48xALUs

nur 24xALUs

Hohoho, ach doch, nur arbeiten sie immer zu zweit, darum 24 Pixelshader.

misterh
2005-12-29, 16:16:57
Hohoho, ach doch, nur arbeiten sie immer zu zweit, darum 24 Pixelshader.

Cb zb zeigt bei 7800GTX (256) die Fillrate so an

Pixelfüllrate 6880 (16xROPs x 430)
Texelfüllrate 10320 (24ALUs x 430)

wenn 48ALUs hätte, dann sollte ja mehr als 10320 bei fillrate test geben. Nur war es nicht so. Also kann es auch keine 48ALUs haben.

Demirug
2005-12-29, 16:18:34
Die Texelfüllrate wird durch die Anzahl der TMUs bestimmt und nicht durch die Anzahl der ALUs

misterh
2005-12-29, 16:23:00
Die Texelfüllrate wird durch die Anzahl der TMUs bestimmt und nicht durch die Anzahl der ALUs

diese hat nur 16xTMUs

Edit:

Ok ich depp.

hat doch 24TMUs. wenn da 1 steht.

reunion
2005-12-29, 16:25:43
Einen 7800GTX hat 24 TMUs.

misterh
2005-12-29, 16:28:31
Jo und was ist mit ALUs? hat es 48?

Hat nur 24ALUs. 100%

Coda
2005-12-29, 16:32:48
Eine 7800GTX hat 48 ALUs, 24 TMUs und 16 ROPs.

misterh
2005-12-29, 16:34:38
Eine 7800GTX hat 48 ALUs, 24 TMUs und 16 ROPs.

o.O so sieht aber nicht in spiel Leistung aus. Zb 3DMarks oder Fear.

ach egal jetzt. weg vom tisch.

Coda
2005-12-29, 16:35:26
Es sind 24 Pipelines mit jeweils 2 ALUs und einer TMU das Ganze wird dann durch 16 ROPs in den Framebuffer geschrieben.

reunion
2005-12-29, 19:40:41
R580, Radeon X1900XTX works at 695/1550MHz: Sixteen pipes and forty eight shaders (http://www.theinq.com/?article=28611)

OUR CHINESE colleagues have reported that R580 comes in a couple of flavours and our Theo wrote about this before. But this time these guys have a picture of the actual hardware and have some of the clock details. The card looks very much like the previous R520 based chip. It comes at very similar clock speeds, or should I saw at almost identical speeds to X1800XT OC cards that are still missing in action, except Asus that already has them ready.
We are still not sure about those numbers but our colleagues are reporting that top card named X1800XTX works at 695MHz core and 1550MHz memory. X1900XT will be clocked at 625MHz core and 1450MHz memory, no surprises there. There will be a Crossfire version of the card as well and samples are out there and ATI is hoping for a late January 2006 launch if not even early February.

The site claims that you need 450W with 30A for a single card while you need a minimum of 550W PSU providing 38A for two cards.

Whenever it officially announces the cards, it will have them in the stores at the same time, in volumes.

The original is HKEPC here and here is some English translated news for you as well.

FUAD kann offensichtlich nichtmal abschreiben.
Er bezieht sich auf den HKEPC-Artikel, gibt aber 695Mhz Coretakt an?

//Edit: VR-Zone ist auch nicht besser: http://www.vr-zone.com/?i=3073 :D
Das kommt davon, wenn man alles nur kopiert, ohne den Kopf einzuschalten.

Ailuros
2005-12-30, 00:43:41
"Deutlich" sehe ich noch nicht so.....der r580 wird wohl 48 Shader-Units haben, der G70 hat schon 48 Shader-Units (und kann trotzdem nicht so viel gegenüber einem r520 reissen).

Das ganze wird sich natürlich verändern, je Shaderlastiger das ganze wird.

Das der r580 wohl schneller als ein G70 / r520 sein wird, ist wohl klar, aber ich erwarte keine Quantensprünge, auch nicht in shaderlastigen Games.

Mal sehen wie viele Shader-Units nV dagegensetzten wird (ich persönlich rechne für den G70 Nachfolger immer noch mit einen oder zwei weiteren "rangepappten" Quads....dann hätte der G80(?) im extremfall schon 64 Shader Units).


Egal wie man zaehlen will, wie bei allen Einheiten zaehlt eher was von jeder rausschiessen kann.

Alternative Methode waere:

G7x = 2 FP32 (oder 8 MADDs) pro SIMD Kanal
R580 = 3 FP32 (oder 12 MADDs) pro SIMD Kanal

Ferengie
2005-12-31, 12:07:12
Dann ist doch auch bestimmt eine neue X1900 All-in-Wonder drin?

Genial wäre es mit DVB-S2.

StefanV
2005-12-31, 13:05:56
Dann ist doch auch bestimmt eine neue X1900 All-in-Wonder drin?

Genial wäre es mit DVB-S2.
1. auf jeden.
2. eher nicht, die meisten Leute haben Kabel oder Terrestisch, da lohnt es sich leider wenig bis garnicht entsprechendes anzubieten...

Die Auswahl an SAT Karten für den PC war bis vor einiger Zeit recht überschaubar, da gabs nur die Pinnacle und die Technotrend Karten.

Ferengie
2005-12-31, 13:24:31
Klar ist DVB-T und analog weltweit weiterverbreitet,

aber

mit DVB-S2 könnte ATI vollends ihr Avivo Feature und HDTV als AS ausspielen.

reunion
2005-12-31, 13:36:16
HKEPC hat wiedermal die NDA nicht so genau genommen: :D

http://www.beyond3d.com/forum/showpost.php?p=661437&postcount=431

Gandharva
2005-12-31, 14:10:13
HKEPC hat wiedermal die NDA nicht so genau genommen: :D

http://www.beyond3d.com/forum/showpost.php?p=661437&postcount=431jupp, das hatte der HKEPC admin bei HKEPC im forum und im futuremark forum kurzzeitig gepostet und dann sofort wieder gelöscht (NDA :rolleyes:) weil ein member im futuremark forum (quaddamage) wehement behauptet hat die HKEPC bilder + taktangaben + stromverbrauch des R580 seien fakes. er wollte wohl klarstellen das nicht nur heisse luft von ihnen kommt. :D

http://img512.imageshack.us/img512/2302/ab17f9b28gp.jpg

seahawk
2005-12-31, 16:57:26
Wollen die ein zweiter Inq. werden ?

deekey777
2005-12-31, 21:02:45
Im seligen R520 Therad hat auch jemand, der sich als HKEPC Admin ausgegeben hatte, kramphaft versucht, Leute zu überzeugen, der R520 hätte 24Pipelines. :biggrin:

mapel110
2006-01-01, 02:18:17
hm, wenn die Taktraten stimmen, muss die aufgebohrte Shaderhardware ja richtig reinhauen.

aths
2006-01-01, 04:39:57
hm, wenn die Taktraten stimmen, muss die aufgebohrte Shaderhardware ja richtig reinhauen.Das hängt davon ab. Einerseits kann die Shader-Leistung nur dann ausgespielt werden, wenn der Shader mit den gesetzten Texturfilter-Einstellungen nicht texelfüllratenlimitiert ist. Andererseits nutzen die Shader-Units bestimmte Ressourcen gemeinsam, dazu zählt zum Beispiel Registerspeicher. Wenn der ausgeht, werden die ALUs mit Leertakten gefüttert.

Der G70 hat, wenn man zwei ALUs pro Pipeline zählt, auch 48 Stück. Ok, der G70 taktet geringer, aber der G70-Nachfolger dürfte entweder deutlich höher takten, oder mit 32 Pixelpipes – also 64 ALUs – kommen.



Wie bekannt, kann der G70 seine ALU-Power vor allem dann ausspielen, wenn es im Shader längere rein arithmetische Passagen gibt. Aber auch der R580 benötigt einen hohen Arithemitik-Anteil im Shader, um eben nicht an der Texelfüllrate zu hängen. Sofern DXT1-Texturen genutzt werden, hängt der G70 beim Texturfiltern gar nicht mal so stark an der Bandbreite. Dennoch sollte sich NV bequemen, beim G70-Nachfolger das Speicherinterface zu verbessern. Eine 8x Crossbar dürfte schon etwas helfen.

Ailuros
2006-01-01, 10:35:57
Dennoch sollte sich NV bequemen, beim G70-Nachfolger das Speicherinterface zu verbessern. Eine 8x Crossbar dürfte schon etwas helfen.

Eben. Der Unterschied zwischen R520/G70 von noAA zu 4xAA ist zu gross dass dieses NV uebersehen koennte. Das Problem ist dann eben ob es Zeit fuer solche Aenderungen gab.

Winter[Raven]
2006-01-01, 11:08:39
Es wird hängt bestimmt auch davon ab wie schwer ist es den Speicherinterface zu überarbeiten ;) Ich tippe mal ganz "leicht" auf "Zeit hat gereicht" ... *gg*

mboeller
2006-01-02, 11:36:14
Es sind 24 Pipelines mit jeweils 2 ALUs und einer TMU das Ganze wird dann durch 16 ROPs in den Framebuffer geschrieben.


??? wirklich 2 ALU + 1 TMU pro "Pipeline"?

Ich dachte es sind nur entweder 2 ALU-Operationen oder 1 TMU und 1 ALU-Operation pro Takt und "Pipeline" möglich.

aths
2006-01-02, 12:40:51
??? wirklich 2 ALU + 1 TMU pro "Pipeline"?

Ich dachte es sind nur entweder 2 ALU-Operationen oder 1 TMU und 1 ALU-Operation pro Takt und "Pipeline" möglich.Das kann man so einfach nicht sagen. Je nach dem, um was für ALU-Operationen es sich handelt, sind auch mehr als 2 ALU-Operationen in einem Takt möglich, selbst wenn gleichzeitig eine Texturoperation ausgeführt wird. (Bei ATI ebenfalls, nur bietet der NV40 und vor allem G70 deutlich mehr Möglichkeiten, in einem Takt mehrere "kleine" ALU-Operationen auszuführen.) Eine Tex-Operation blockiert beim NV40 und G70 allerdings (wichtige) Teile der ersten ALU.

Ailuros
2006-01-02, 15:09:30
Ganz so nebenbei:

Fear noAA 1600*1200:

bilinear = 58 fps
16xAF = 52 fps

Godmode
2006-01-02, 15:21:59
Ganz so nebenbei:

Fear noAA 1600*1200:

bilinear = 58 fps
16xAF = 52 fps

Fast kein Framerateneinbruch => dh F.E.A.R hängt nicht wirklich an der Fillrate, das wussten wir doch schon, oder?

mapel110
2006-01-02, 15:27:03
Ganz so nebenbei:

Fear noAA 1600*1200:

bilinear = 58 fps
16xAF = 52 fps
Kann das nicht auch daran liegen, dass die Texturfüllrate ohnehin verpufft, weil die Speicherbandbreite zu gering ist (schon bei 1600x1200 NoAA/NoAF). Also man somit quasi bei 16xAF den Flaschenhals erst wieder halbwegs Richtung Texturfüllrate bewegt?!
Dafür würden dann auch die AA-Benches sprechen, wo es ja so große Einbrüche gibt.

Überprüfen kann man das wohl, wenn man mal ein Game bencht, das nicht so shaderlastig sein soll. Aber da gibts ja nichts richtig forderndes, oder? bzw da fällt mir jetzt nichts ein.

Coda
2006-01-02, 16:04:50
??? wirklich 2 ALU + 1 TMU pro "Pipeline"?Ja, zumindest für die oft gebrauchten Befehle. Es gibt auch Spezialfälle die entweder von Alu #1 oder #2 abgearbeitet werden.

Ich installier mir bei Gelegenheit mal nen Monitoring-Treiber von nVIDIA und schau mir die Performance-Counter bei FEAR an, das interessiert mich auch irgendwie. Ich hab das dumme Gefühl dass die Occlusion-Queries für die Verdeckungsbestimmung verwenden und dass das ziemlich oft stallt - zumindest sieht der Editor sehr danach aus.

reunion
2006-01-02, 16:35:20
Ganz so nebenbei:

Fear noAA 1600*1200:

bilinear = 58 fps
16xAF = 52 fps


Welche Karte?

Ailuros
2006-01-02, 16:38:14
Kann das nicht auch daran liegen, dass die Texturfüllrate ohnehin verpufft, weil die Speicherbandbreite zu gering ist (schon bei 1600x1200 NoAA/NoAF). Also man somit quasi bei 16xAF den Flaschenhals erst wieder halbwegs Richtung Texturfüllrate bewegt?!
Dafür würden dann auch die AA-Benches sprechen, wo es ja so große Einbrüche gibt.

Überprüfen kann man das wohl, wenn man mal ein Game bencht, das nicht so shaderlastig sein soll. Aber da gibts ja nichts richtig forderndes, oder? bzw da fällt mir jetzt nichts ein.


bans3i hat den Nagel auf den Kopf getroffen.

Der Speicher war uebrigens in diesem Fall auf 685MHz getaktet was 44GB/s Bandbreite entspricht.

Ailuros
2006-01-02, 16:39:59
Welche Karte?

7800GTX@ 490/685MHz

http://www.xbitlabs.com/articles/video/display/games-2005_12.html

reunion
2006-01-02, 16:52:05
7800GTX@ 490/685MHz

http://www.xbitlabs.com/articles/video/display/games-2005_12.html


Und das 16xAF war tri, oder auch bi?

Ailuros
2006-01-02, 16:55:18
Und das 16xAF war tri, oder auch bi?

52 fps in game bilinear, CP high quality
58 fps in game 16xAF, CP high quality

reunion
2006-01-02, 17:01:27
58 fps in game bilinear, CP high quality
52 fps in game 16xAF, CP high quality

Okay, das ist wirklich sehr wenig, intressant wären noch Ergebnisse mit einem R520.

Ailuros
2006-01-02, 17:21:47
Okay, das ist wirklich sehr wenig, intressant wären noch Ergebnisse mit einem R520.

Einen besonderen Unterschied wird es hier auch nicht ausmachen, da die X1800XT@default auf 51 fps noAA/AF kommt. Mit 4xAA/16xAF verliert sie laut dem obrigen Link ca. 24% und kommt auf anstaendige 39 fps, waehrend die 512 GTX von 64 auf 35 fps (-45%) mit 4xAA/16xAF faellt. Ich sag ja schon seit einer Ewigkeit dass die ausgezeichnete AA Leistung des R520 auf dem Speichercontroller hauptsaechlich beruht, nur will es mir keiner glauben.

Wuerde sie auch 45% mit 4xAA verlieren, dann waeren es nur 28 fps Durchschnitt und sie waere somit um 25% langsamer als die 512 GTX. Genau deshalb stimme ich auch aths zu, dass NVIDIA eine Aenderung in der Speicherverwaltung braucht wenn sie in solchen Faellen gegen den R580 effektiv konkurrieren moechten.

Mr. Lolman
2006-01-02, 17:54:09
Mit HQ ist der Unterschied logischerweise noch größer. ;)

reunion
2006-01-02, 23:08:28
Einen besonderen Unterschied wird es hier auch nicht ausmachen, da die X1800XT@default auf 51 fps noAA/AF kommt.
Mit 4xAA/16xAF verliert sie laut dem obrigen Link ca. 24% und kommt auf anstaendige 39 fps, waehrend die 512 GTX von 64 auf 35 fps (-45%) mit 4xAA/16xAF faellt. Ich sag ja schon seit einer Ewigkeit dass die ausgezeichnete AA Leistung des R520 auf dem Speichercontroller hauptsaechlich beruht, nur will es mir keiner glauben.

Wuerde sie auch 45% mit 4xAA verlieren, dann waeren es nur 28 fps Durchschnitt und sie waere somit um 25% langsamer als die 512 GTX. Genau deshalb stimme ich auch aths zu, dass NVIDIA eine Aenderung in der Speicherverwaltung braucht wenn sie in solchen Faellen gegen den R580 effektiv konkurrieren moechten.

Natürlich trägt der Speichercontroller auch seinen Teil dazu bei, dass R520 mit Qualitätssettings kaum Leistung verliert, allerdings denken ich, dass es da noch viele andere Gründe gibt.

Wenn man sich Test des R520 ansieht, fällt als erstes auf, dass die Grundgeschwindigkeit im Vergleich zu den nV-Karten relativ bescheiden ist. Ich nehme an, dass da noch irgendetwas anderes limitiert, vermutlich fehlt es etwas an Shaderpower. Falls dies der Fall wäre, würde dadurch der prozentuelle Verlust mit AA/AF zwangsläufig sinken. Desweiteren steigt der Nutzen der nebenläufigen TMUs mit zunehmenden Filterungsgrad logischweise an, wodurch R520 durch AF auch weniger Leistung verlieren sollte, als G70 - wobei die höhere Füllrate der "GTX 512" hier einges wieder wettmachen müsste. Und dann sollte der von dir angepriesene Speichercontroller, sowie das stark verbesserte Cachingsystem natürlich auch seinen Teil dazu beitragen.

Ailuros
2006-01-03, 00:43:24
Mit HQ ist der Unterschied logischerweise noch größer. ;)

Gilt dann aber fuer beide.

Ailuros
2006-01-03, 00:48:46
Natürlich trägt der Speichercontroller auch seinen Teil dazu bei, dass R520 mit Qualitätssettings kaum Leistung verliert, allerdings denken ich, dass es da noch viele andere Gründe gibt.

Wenn man sich Test des R520 ansieht, fällt als erstes auf, dass die Grundgeschwindigkeit im Vergleich zu den nV-Karten relativ bescheiden ist. Ich nehme an, dass da noch irgendetwas anderes limitiert, vermutlich fehlt es etwas an Shaderpower. Falls dies der Fall wäre, würde dadurch der prozentuelle Verlust mit AA/AF zwangsläufig sinken. Desweiteren steigt der Nutzen der nebenläufigen TMUs mit zunehmenden Filterungsgrad logischweise an, wodurch R520 durch AF auch weniger Leistung verlieren sollte, als G70 - wobei die höhere Füllrate der "GTX 512" hier einges wieder wettmachen müsste. Und dann sollte der von dir angepriesene Speichercontroller, sowie das stark verbesserte Cachingsystem natürlich auch seinen Teil dazu beitragen.


http://www.beyond3d.com/forum/showpost.php?p=661338&postcount=425

Ja natuerlich sind diese keine high end GPUs aber achte mal auf die RV530 Leistungs-Unterschiede.

Coda
2006-01-03, 00:58:48
Ich hab FEAR jetzt mal ausgemessen. Die Pixelshader warten durchschnittlich ca 15% der Zeit auf die TMUs bei nem G70, schwankt allerdings zwischen 10 und 20%. Eingestellt war 8xAF.

Ailuros
2006-01-03, 01:21:39
Kein Wunder da der Unterschied mit dem eingebauten timedemo zwischen bilinear und 16xAF bei ~10% liegt. Spielt man in Echtzeit eine laengere Sequenz durch, duerfte diese Analogie hoeher sein.

Coda
2006-01-03, 01:23:22
Kein Timedemo, war irgendwo an ner Stelle wos besonders mies lief.

Ailuros
2006-01-03, 01:48:20
Kein Timedemo, war irgendwo an ner Stelle wos besonders mies lief.

Das meinte ich auch. Ich sprach von dem timedemo dass ich fuer meine Resultate benutzte.

reunion
2006-01-03, 13:18:52
http://www.beyond3d.com/forum/showpost.php?p=661338&postcount=425

Ja natuerlich sind diese keine high end GPUs aber achte mal auf die RV530 Leistungs-Unterschiede.


Mhm, nicht unintressant, man sollte ja annehmen, dass RV530 hier prozentuell mehr Leistung verliert, als RV515 - dies scheint aber zumindest bei Doom 3 nicht der Fall zu sein. Wobei Doom 3 mit Sicherheit kein optimales Beispiel ist, bei anderen Spielen kanns schon wieder ganz anders aussehen.

Ailuros
2006-01-03, 14:20:46
Mhm, nicht unintressant, man sollte ja annehmen, dass RV530 hier prozentuell mehr Leistung verliert, als RV515 - dies scheint aber zumindest bei Doom 3 nicht der Fall zu sein. Wobei Doom 3 mit Sicherheit kein optimales Beispiel ist, bei anderen Spielen kanns schon wieder ganz anders aussehen.

Fuer den Zweck der Sache ist der Test gar nicht so daneben. Haette er - wie er selber sagt - z.B. Quake4 benutzt haetten andere Faktoren wie hoeherer Vertex-load die Sache zu stark kompliziert. In unserem Fall geht es um Speicherverwaltung und diese ist fuer AF eher von geringer Wichtigkeit wenn ueberhaupt; ganz im Gegenteil zu AA.

Zum letzten gibt es noch das folgende:

http://www.beyond3d.com/forum/showthread.php?t=27037

reunion
2006-01-05, 14:12:42
Hier noch eine intressante Meldung von VR-Zone:

Radeon X1900 XTX To Score Over 11K? (http://www.vr-zone.com/?i=3085)

We came to know that Radeon X1900 XTX (R580) will officially be clocked at 650MHz core and 1550Mhz for the memory while the X1900 XT will be officially clocked at 625MHz / 1450MHz. The reason for the lower memory clocks for X1900 XT is unclear yet since the X1800XT is already clocked at 1.5GHz. It is also confirmed that R580 has 16 pipelines and 48 shader processors.

More interestingly, we heard faintly that an early sample of X1900 XTX clocked at 500MHz scored 10.2K in 3DMark05 so we can safely presume that the official X1900 XTX will score over 11K. We can expect availability at launch on 24th January and retailers are expected to have stocks a few days before the launch. However, NVIDIA won't just allow ATi to steal the performance crown from them so G71 will be their answer to R580 and it seems NVIDIA is confident that G71 will beat R580. All it takes is a highly clocked, 32 pipes G71 to stop R580.

reunion
2006-01-05, 14:14:14
Fuer den Zweck der Sache ist der Test gar nicht so daneben. Haette er - wie er selber sagt - z.B. Quake4 benutzt haetten andere Faktoren wie hoeherer Vertex-load die Sache zu stark kompliziert. In unserem Fall geht es um Speicherverwaltung und diese ist fuer AF eher von geringer Wichtigkeit wenn ueberhaupt; ganz im Gegenteil zu AA.

Zum letzten gibt es noch das folgende:

http://www.beyond3d.com/forum/showthread.php?t=27037

Danke.

Ronny145
2006-01-05, 14:24:30
Das wären 19 Tage nur noch. Also jetzt noch eine X1800XT zu kaufen wäre reichlich sinnfrei. Bei dem 3dmark05 Wert muss schon reichlich die CPU limitieren. Ist die verwendete CPU bekannt? Wird es vielleicht sowas wie eine XL noch später geben?

Godmode
2006-01-05, 14:47:40
Das wären 19 Tage nur noch. Also jetzt noch eine X1800XT zu kaufen wäre reichlich sinnfrei. Bei dem 3dmark05 Wert muss schon reichlich die CPU limitieren. Ist die verwendete CPU bekannt? Wird es vielleicht sowas wie eine XL noch später geben?

Ja ganau so irrsinnig wie jetzt noch eine GTX512 zu kaufen. Ich bin echt gespannt ob der G70 dann wirklich 32 Pipes @ ca 700Mhz Takt bekommt, das wären immerhin 33 % mehr Pipes + 27 % mehr Takt gegenüber einer GTX512, was mir etwas zuviel vorkommt. Ich denke eher so: entweder mehr Pipes bei etwa gleichem Takt, oder gleiche Anzahl von Pipes, dafür aber mehr Takt.

Ja immer bekommen wir diese %$"§%& 3DMarks, interessanter wäre da schon F.E.A.R. oder sowas in der Art.

Bezüglich der XL, also ich kann mir gut vorstellen das es auch wieder abgespeckte Versionen geben wird von beiden Seiten.

Ailuros
2006-01-05, 15:22:08
Ja ganau so irrsinnig wie jetzt noch eine GTX512 zu kaufen. Ich bin echt gespannt ob der G70 dann wirklich 32 Pipes @ ca 700Mhz Takt bekommt, das wären immerhin 33 % mehr Pipes + 27 % mehr Takt gegenüber einer GTX512, was mir etwas zuviel vorkommt. Ich denke eher so: entweder mehr Pipes bei etwa gleichem Takt, oder gleiche Anzahl von Pipes, dafür aber mehr Takt.

Ja immer bekommen wir diese %$"§%& 3DMarks, interessanter wäre da schon F.E.A.R. oder sowas in der Art.

Bezüglich der XL, also ich kann mir gut vorstellen das es auch wieder abgespeckte Versionen geben wird von beiden Seiten.


Rechnet man die ADD Funktionen der R5xx-ALUs noch mit, brauechte man bei fuer rein theoretische GFLOP Zaehlereien, eigentlich 8 quads mit 730MHz. Klingt mir ein bisschen zu optimistisch um ehrlich zu sein.

robbitop
2006-01-05, 16:22:16
Rechnet man die ADD Funktionen der R5xx-ALUs noch mit, brauechte man bei fuer rein theoretische GFLOP Zaehlereien, eigentlich 8 quads mit 730MHz. Klingt mir ein bisschen zu optimistisch um ehrlich zu sein.
Welche ADD Funktionen? Du spielst doch jetzt nicht auf das zusätzliche ADD4 der MiniALUs an?
Um den Vergleich nicht noch unnötig unübersichtlicher zu lassen sollte man die MiniALUs herauslassen...beide IHVs setzen die Dinger ein.

Der Vergleich der ALUs ist so oder ziemlich müßig.
Beide ALU Typen können mindestens MAD und Dot3. Laut einer einfachen Rechnung mit MAD als Indikator also per se gleichstark.
Die SU0 vom G70 hingegen kann kein SFU und die SU1 wird durch Texturfetches belastet. Die ganze Pipeline kann stallen, wenn das T-A Verhälltnis nicht passt. In der Praxis sind die R5xx ALUs per se stärker, dafür hat G71 eventuell mehr davon. Das könnte sich von der Aritmetik ausgleichen.
Um genaue Aussagen machen zu können, kommt es natürlich auf den jeweiligen Shader an {es gibt Situationen, in denen G7x überlegen wäre..gutes T-A Verhältnis, passender Shadercode (also SFU kommt nicht zu häufig vor)...oder aber auch R5xx...ich denke R5xx ist hier robuster}.

Sowieso kann m.E. MADD in GFLOPs nur als grober Indikator für PS Leistung gewertet werden...es spielt zuviel mit hinein (und auch andere Funktionen sind durchaus wichtig).

Von der Rohfüllrate her wird R580 weggehauen...es ist nur die Frage, wie wichtig das heute noch ist und wieviel davon mangels Bandbreite verloren geht.

Gast
2006-01-05, 21:34:49
Ich bin jetzt bereit für die X1900 oder die GF 7900 ^^
Hoffe es gibt jetzt bald gescheite Spieletests die auch überzeugen können. Also wenn die X1900XT oder XTX immer mindestens so schnell wie ne GTX 512 ist wär das schon fein, sollte sie langsamer sein muss ich auf die 7900 warten :(

Ailuros
2006-01-06, 02:29:41
Welche ADD Funktionen? Du spielst doch jetzt nicht auf das zusätzliche ADD4 der MiniALUs an?
Um den Vergleich nicht noch unnötig unübersichtlicher zu lassen sollte man die MiniALUs herauslassen...beide IHVs setzen die Dinger ein.

http://www.beyond3d.com/reviews/ati/r520/index.php?p=03


Der Vergleich der ALUs ist so oder ziemlich müßig.
Beide ALU Typen können mindestens MAD und Dot3. Laut einer einfachen Rechnung mit MAD als Indikator also per se gleichstark.

Nein wenn ich auschliesslich mit MADDs rechne sind es R520 = 16 * 4 MADDs gegen G70= 24 * 8 MADDs.

Die SU0 vom G70 hingegen kann kein SFU und die SU1 wird durch Texturfetches belastet. Die ganze Pipeline kann stallen, wenn das T-A Verhälltnis nicht passt. In der Praxis sind die R5xx ALUs per se stärker, dafür hat G71 eventuell mehr davon. Das könnte sich von der Aritmetik ausgleichen.

Falls der neueste Mist von ATI stimmen sollte auf den ich gekommen bin, sind es ~370 GFLOPs fuer R580. Probier mal mit dem bekannten G7x Aufbau so viel GFLOPs zu erreichen. Ja es ist nur sterile Mathe, aber zu der Kategorie gehoeren GFLOPs und Arithmetik sowieso.

Um genaue Aussagen machen zu können, kommt es natürlich auf den jeweiligen Shader an {es gibt Situationen, in denen G7x überlegen wäre..gutes T-A Verhältnis, passender Shadercode (also SFU kommt nicht zu häufig vor)...oder aber auch R5xx...ich denke R5xx ist hier robuster}.

Sowieso kann m.E. MADD in GFLOPs nur als grober Indikator für PS Leistung gewertet werden...es spielt zuviel mit hinein (und auch andere Funktionen sind durchaus wichtig).

Von der Rohfüllrate her wird R580 weggehauen...es ist nur die Frage, wie wichtig das heute noch ist und wieviel davon mangels Bandbreite verloren geht.

Siehe oben. Nichtdestominder und die bloede Formel stammt von NV's eigenen Dokumenten nur jetzt spekulativ auf G7x angepasst:

32 * 8 MADDs/clk = 256 MADDs/clk * 0.73GHz = 187 GMADDs * 2 = 374 GFLOPs.

Lassen wir mal die moeglichen Flaschenhaelse der einen oder anderen Seite weg; NV sieht mir nicht danach als ob sie auch diesmal eine hoehere arithmetische Rate schaffen werden, ausser natuerlich es gibt extravagante Taktraten oder es gibt Aenderungen die mir nicht bewusst sind.

robbitop
2006-01-06, 11:43:29
http://www.beyond3d.com/reviews/ati/r520/index.php?p=03

Ja das habe ich damals schon kritisiert. Weder R3xx noch R5xx verfügen über 2x richtige Vec4 ALUs pro Pipe. (wäre dem so, hätte NV4x und G7x echt alt ausgesehen)



Nein wenn ich auschliesslich mit MADDs rechne sind es R520 = 16 * 4 MADDs gegen G70= 24 * 8 MADDs.
Du rechnest also nicht Vec4 MADDs sondern skalare? Naja muss man natürlich um auf FLOPs zu kommen ... aber ich finde das total hirnrissig.



Falls der neueste Mist von ATI stimmen sollte auf den ich gekommen bin, sind es ~370 GFLOPs fuer R580. Probier mal mit dem bekannten G7x Aufbau so viel GFLOPs zu erreichen. Ja es ist nur sterile Mathe, aber zu der Kategorie gehoeren GFLOPs und Arithmetik sowieso.
Naja ist eine Frage der Zählweise. Wenn NV zählt, wie sie es sehen, kann der NV30 bsw 48 PS Ops pro Takt raushauen ... R300 nur 24. Insofern ist sowas nicht vergleichbar.



Siehe oben. Nichtdestominder und die bloede Formel stammt von NV's eigenen Dokumenten nur jetzt spekulativ auf G7x angepasst:

32 * 8 MADDs/clk = 256 MADDs/clk * 0.73GHz = 187 GMADDs * 2 = 374 GFLOPs.
Ich sage ja nicht, dass die Formel, um die MADD FLOPs zu berechnen falsch ist. Nur sehe ich, dass sie IMO zu oft und zu unkommentiert genutzt wird. Das suggeriert vielen, dass es ein guter Indikator für die PS Leistung ist. Es ist höchstens ein sehr sehr grober.


Lassen wir mal die moeglichen Flaschenhaelse der einen oder anderen Seite weg; NV sieht mir nicht danach als ob sie auch diesmal eine hoehere arithmetische Rate schaffen werden, ausser natuerlich es gibt extravagante Taktraten oder es gibt Aenderungen die mir nicht bewusst sind.
Wenn G71 (oder whatever) wirklich mit 8 Quads kommt und rund 700MHz sollte das ungefähr hinkommen. Ich zweifle allerdings noch ein wenig daran.

Gast
2006-01-06, 11:52:33
Du rechnest also nicht Vec4 MADDs sondern skalare? Naja muss man natürlich um auf FLOPs zu kommen ... aber ich finde das total hirnrissig.

Oder MADD als zwei Ops: MUL+ADD.

Bleibt sich für die Zahlen aber gleich, bis jemand mit einem 1:1:2 oder 1:1:3 Split kommt.

Ailuros
2006-01-06, 12:17:01
Ich sage ja nicht, dass die Formel, um die MADD FLOPs zu berechnen falsch ist. Nur sehe ich, dass sie IMO zu oft und zu unkommentiert genutzt wird. Das suggeriert vielen, dass es ein guter Indikator für die PS Leistung ist. Es ist höchstens ein sehr sehr grober.

http://www.forum-3dcenter.org/vbulletin/showpost.php?p=3850545&postcount=27

Wenn ATI jetzt auch die ADD-Raten besteht rechne ich sie eventuell dann eben mit. Selbst wenn solch eine Rechnung eine optimistische Verdrehung der Realitaet sein sollte, und es sind nur sagen wir mal 250-280GFLOPs fuer R580 in Realitaet, aendert es kein bisschen an der Tatsache dass NV hier einen wesentlichen Vorteil verliert.


Wenn G71 (oder whatever) wirklich mit 8 Quads kommt und rund 700MHz sollte das ungefähr hinkommen. Ich zweifle allerdings noch ein wenig daran.

Ich koennte mir einen extreme-Taktraten-Krieg mit beschissener Verfuegbarkeit fuer beide sogar vorstellen. Rein spekulativ und von den bisher bekannten Daten aber sieht es fuer G7x vielleicht doch nicht so gut aus wie ich mir bisher vorstellte.

512 GTX ist in Fear/1600/4xAA/16xAF bei 35 fps und X1800XT bei 39 fps. Ob Du jetzt 80 oder 120GFLOPs gegen die 210 GFLOPs der 512 GTX rechnen willst ist mir weniger wichtig. Die X-beliebige ALU-Leistungsrate ist eben mal Mal 3x fuer R580 + den Speichercontroller der AA Leistungsverluste minimalisiert.

robbitop
2006-01-06, 12:27:39
Oder MADD als zwei Ops: MUL+ADD.

Bleibt sich für die Zahlen aber gleich, bis jemand mit einem 1:1:2 oder 1:1:3 Split kommt.
AFAIK gibts eine MADD Operation per se nicht. Eine MAD Unit kann entweder ein MUL4 oder ein ADD4 beisteuern oder ein DP4.
Obige Splits sind übrigens Unsinn. Co Issue erlaubt auf derzeitigen ATI Chips 3:1 und bei derzeitigen NV Chips 3:1 und 2:2.

reunion
2006-01-06, 12:28:51
Verfügbarkeit ab dem 22. Januar...
http://www.rage3d.com/board/showthread.php?t=33840644

...Mit zurzeit allerdings gesalzenen Preisen:
http://www.grosbill.com/index.php3?id=34643&site=ruehardware

robbitop
2006-01-06, 12:30:14
512 GTX ist in Fear/1600/4xAA/16xAF bei 35 fps und X1800XT bei 39 fps. Ob Du jetzt 80 oder 120GFLOPs gegen die 210 GFLOPs der 512 GTX rechnen willst ist mir weniger wichtig. Die X-beliebige ALU-Leistungsrate ist eben mal Mal 3x fuer R580 + den Speichercontroller der AA Leistungsverluste minimalisiert.
Oh oh, böses Faul. Wenn du die PS Leistung vergleichen willst in einem Praxisspiel kannst du doch nicht AA/AF dazuhauen. Dann ist der Flaschenhals PS Leistung durch Bandbreite und Füllrate und unterschiedliche Art und Weisen der Realisierung dieser Verfahren verhunzt.
Wenn dann muss es pure speed sein.
ATI's AF ist viel zu anders und ATI's neuer Memorycontroller und die verdammt guten Caches holen hier bei AA sehr viel raus. Ich bezweifle, dass hier noch reine PS Limitierung vorliegt.

Ailuros
2006-01-06, 12:34:41
Oh oh, böses Faul. Wenn du die PS Leistung vergleichen willst in einem Praxisspiel kannst du doch nicht AA/AF dazuhauen.

Das Endresultat interessiert mich genauso und ueberhaupt im high end. Wenn man hier kein AA/AF benutzt sollte man sich die Unkosten gleich sparen und mainstream oder value kaufen.

Dann ist der Flaschenhals PS Leistung durch Bandbreite und Füllrate und unterschiedliche Art und Weisen der Realisierung dieser Verfahren verhunzt.
Wenn dann muss es pure speed sein.
ATI's AF ist viel zu anders und ATI's neuer Memorycontroller und die verdammt guten Caches holen hier bei AA sehr viel raus. Ich bezweifle, dass hier noch reine PS Limitierung vorliegt.

In diesem Fall ist es das winkelabhaengigere AF + Optimierungen, das "anders" kann ich hier nicht sehen. Ja zum Speichercontroller und der AA Leistung, da die 512 GTX von 1x auf 4xAA ~45% verliert, waerend die X1800XT nur 24%.

Das Demirug ein maximales ALU-Tex ratio von 7:1 in Fear gemessen hat ist bekannt.

reunion
2006-01-06, 12:41:34
http://www.beyond3d.com/reviews/ati/r520/index.php?p=03


ATi spricht in allen Dokumenten von 83 GFLOPs für R520. Es sollte klar sein, dass man hier eher zu viel, als zu wenig angibt. Du hast also IMHO irgendwo einen Fehler in deiner Rechnung.

robbitop
2006-01-06, 12:41:59
Das Endresultat spricht jedoch nicht über die PS Leistung, auf die du hinauswolltest. Somit ist dieses Beispiel für mich hinsichtlich der PS Leistung nicht zulässig. Die Resultate sind IMO eher durch andere Dinge beeinträchtigt.
Allein das AF erhöt die Texturlast enorm. Das AA klaut sehr viel Bandbreite...da ist die PS Leistung allein nicht mehr entscheident.

Ailuros
2006-01-06, 12:51:04
Das Endresultat spricht jedoch nicht über die PS Leistung, auf die du hinauswolltest. Somit ist dieses Beispiel für mich hinsichtlich der PS Leistung nicht zulässig. Die Resultate sind IMO eher durch andere Dinge beeinträchtigt.
Allein das AF erhöt die Texturlast enorm. Das AA klaut sehr viel Bandbreite...da ist die PS Leistung allein nicht mehr entscheident.

Wuerdest Du nicht nur allein fuer's Argument argumentieren, waeren manche Debatten auch einfacher. Ich weiss genau auf was ich hinaus wollte:

a) G70 hat im Vergleich zu R520 u.a. den wesentlichen Vorteil der um einiges hoeheren ALU-Leistung.

b) R580 verdreifacht die R520-ALU Leistung. Vorteil (a) existiert nicht mehr.

c) Wirft man jetzt alles in einen Topf und spekuliert ueber das moegliche Endresultat (um das es auch eigentlich geht) und all die vorerwaehnten Faktoren/Moeglichkeiten mitberechnet, sehe ich bei einem G7x/8 quads mit 600-650MHz keinen klaren Gewinner ausser sie haben was an der Aufteilung des Speichercontrollers als Beispiel u.a. geaendert.

***edit: und da ich schon Fear in vorigen Posts erwaehnte, nochmal der Verlust von bilinear 1xAF auf trilinear 16xAF in 1600 liegt bei 10% auf G70.

Gast
2006-01-06, 12:53:17
AFAIK gibts eine MADD Operation per se nicht. Eine MAD Unit kann entweder ein MUL4 oder ein ADD4 beisteuern oder ein DP4.
Obige Splits sind übrigens Unsinn. Co Issue erlaubt auf derzeitigen ATI Chips 3:1 und bei derzeitigen NV Chips 3:1 und 2:2.
Deswegen zählt Ailuros ja auch MADDs doppelt, weil es eben insgesamt zwei Vec4-Operationen sind.

Die Splits sind nicht Unsinn, du hast meinen Beitrag nur nicht verstanden. Mir ist bekannt, dass aktuelle ATi-Chips einen 3:1 Split bieten und Nvidia darüber hinaus noch 2:2 – diese Eigenheit wird als "Co-Issue" bezeichent. So wie du es formulierst, klingt es wie ein eigenständiges Feature namens "Co-Issue".

Gerade weil es die 1:1:2- oder 1:1:3-Splits noch nicht gibt (btw weiß ich nicht, was Xenos/C1 in dieser Hinsicht kann - die ALUs sind ja fünfkanalig), sagte ich "wenn mal jemand damit ankommt". Mit jemand war nicht ein Robbitop oder sonst ein User, sondern ein IHV gemeint.

Nur weil du Beiträge nicht verstehst, ist das kein Grund, gleich patzig zu werden.

Gast
2006-01-06, 12:56:18
ATi spricht in allen Dokumenten von 83 GFLOPs für R520.
In welchen wäre das? Ich kann mich an diese Zahl gerade nicht erinnern. PDF-Namen und Seitenzahlen genügen, Links brauche ich, glaub' ich, erstmal nicht.

Ailuros
2006-01-06, 12:59:31
Gerade weil es die 1:1:2- oder 1:1:3-Splits noch nicht gibt (btw weiß ich nicht, was Xenos/C1 in dieser Hinsicht kann - die ALUs sind ja fünfkanalig),...

OT: ATI behauptete glaub ich irgendwo eine verrueckte GFLOP Rate, die Gott weiss wie ausgerechnet wurde. Ich persoenlich wuerde eher auf 192GFLOPs wetten, obwohl ich als Laie diese eher GPGFLOPs nennen wuerde ;)

robbitop
2006-01-06, 13:02:12
Wuerdest Du nicht nur allein fuer's Argument argumentieren, waeren manche Debatten auch einfacher. Ich weiss genau auf was ich hinaus wollte:

a) G70 hat im Vergleich zu R520 u.a. den wesentlichen Vorteil der um einiges hoeheren ALU-Leistung.

b) R580 verdreifacht die R520-ALU Leistung. Vorteil (a) existiert nicht mehr.

c) Wirft man jetzt alles in einen Topf und spekuliert ueber das moegliche Endresultat (um das es auch eigentlich geht) und all die vorerwaehnten Faktoren/Moeglichkeiten mitberechnet, sehe ich bei einem G7x/8 quads mit 600-650MHz keinen klaren Gewinner ausser sie haben was an der Aufteilung des Speichercontrollers als Beispiel u.a. geaendert.

***edit: und da ich schon Fear in vorigen Posts erwaehnte, nochmal der Verlust von bilinear 1xAF auf trilinear 16xAF in 1600 liegt bei 10% auf G70.
Ich argumentiere schon mit Sinn. Wenn man die PS Leistung vergleichen will, muss man sie isolieren. Wenn man das Endergebnis vergleichen will ist das etwas anderes. Da spielt die PS Leistung sicher auch mit hinein. Aber mir war nicht bewußt, dass du darauf hinauswolltest.
Ich bin eher dafür, einzelne Komponenten zu isolieren und dann das Gesamtergebnis zu betrachen. In deinem Beispiel sollte die Bandbreite dank 4xAA der Hauptschuldige sein.

Ailuros
2006-01-06, 13:03:30
In welchen wäre das? Ich kann mich an diese Zahl gerade nicht erinnern. PDF-Namen und Seitenzahlen genügen, Links brauche ich, glaub' ich, erstmal nicht.

Das stimmt tatsaechlich und es wird auch in GPGPU Investigationen erwaehnt. Der Verruecktheit zuliebe schanken die GFLOP Raten die von NV fuer G70 angegeben werden von 165 bis weit ueber 300. Kommt ganz drauf an von was jemand gerade traeumt.

Ich hab jetzt mal die ADDs aber mit Absicht in die Luft geworfen weil ich staendig daran erinnert werde dass ich diese mitzaehlen sollte. Die eigentliche Wahrheit koennte man wohl nur mit spezialisierten Tools erwerben. Wenn ich mich nicht irre kann man aber die 165 GFLOPs der G70 in GPUbench zumindest nachstellen.

Ailuros
2006-01-06, 13:06:44
Ich argumentiere schon mit Sinn.

Auf Deinen eigenen Massstaeben.

Wenn man die PS Leistung vergleichen will, muss man sie isolieren. Wenn man das Endergebnis vergleichen will ist das etwas anderes. Da spielt die PS Leistung sicher auch mit hinein. Aber mir war nicht bewußt, dass du darauf hinauswolltest.

Isoliert liegt G70@430MHz > R520@625MHz, aber wohl nicht G7x@600MHz > R580@650MHz.

Ich bin eher dafür, einzelne Komponenten zu isolieren und dann das Gesamtergebnis zu betrachen. In deinem Beispiel sollte die Bandbreite dank 4xAA der Hauptschuldige sein.

512GTX und X1800XT haben jeweils wieviel Bandbreite verfuegbar?

robbitop
2006-01-06, 13:09:04
Deswegen zählt Ailuros ja auch MADDs doppelt, weil es eben insgesamt zwei Vec4-Operationen sind.
Wieso doppelt? Er zählt pro G70 Pipeline 8x MADs. Bei 2xVec4 ALUs ist das keinesfalls doppelt (da es eben 2xMUL4 oder 1xMUL4 + 1xADD4 oder 1xDP4 +1xMUL4 wären). Oder reden wir hier irgendwie aneinander vorbei?


Die Splits sind nicht Unsinn, du hast meinen Beitrag nur nicht verstanden.
Dazu müsste man die ALU in 3 Teile aufteilen. Es wäre vieleicht kein Unsinn, aber ich denke, dass es fraglich ist, ob das Kosten/Nutzenverhältnis hier noch stimmen würde.


Mir ist bekannt, dass aktuelle ATi-Chips einen 3:1 Split bieten und Nvidia darüber hinaus noch 2:2 – diese Eigenheit wird als "Co-Issue" bezeichent.
Richtig.


So wie du es formulierst, klingt es wie ein eigenständiges Feature namens "Co-Issue".
Ich denke, ich bin mir (natürlich bis zu einem gewissen Punkt)im Klaren, was Co-Issue bedeutet.


Nur weil du Beiträge nicht verstehst, ist das kein Grund, gleich patzig zu werden.
Du nimmst Dinge persönlich und wirst persönlich. Keine gute Ebene für eine Diskussion. Aber dennoch: sorry :)

[dzp]Viper
2006-01-06, 13:12:10
Isoliert liegt G70@430MHz > R520@625MHz, aber wohl nicht G7x@600MHz > R580@650MHz.


G7X @ 600MHZ - erstmal abwarten ;)
Das ist mehr als nur Spekulation

robbitop
2006-01-06, 13:15:42
Auf Deinen eigenen Massstaeben.
Nach analytischen Maßstäbe. Ich versuche hier möglichst isoliert zu betrachten. Wenn man von der PS Leistung spricht, sollte man sie Isolieren. Spricht man von der Gesamtleistung mit Einfluss auf die PS Leistung, gebe ich dir recht. Ich ging von Ersterem aus. Wir reden viel aneinander vorbei, da wir beide immer unterschiedliche Dinge interpretieren, denke ich. Es macht dennoch großen Spaß, mit dir zu diskutieren. :)




Isoliert liegt G70@430MHz > R520@625MHz, aber wohl nicht G7x@600MHz > R580@650MHz.
Letzteres kommt auf den finalen Aufbau und die Taktrate von G71 an. So wie du es hier darlegst, vermutlich nicht. Jedenfalls nicht von der aritmetischen Leistung. Von der Gesamtleistung ist es fraglich.




512GTX und X1800XT haben jeweils wieviel Bandbreite verfuegbar?
Rohbandbreite allein sagt gar nichts.
R520 hat eine exzellente Cache-assoziativität und einen deutlich effizienteren Memorycontroller als G70. Wie schwer das wiegt, weiß ich nicht. Ich sehe jedoch, dass der Einbruch bei 4xAA beim R520 geringer ist als bei G70...da muss man nur noch 1+1 zusammenzählen.

Ailuros
2006-01-06, 13:38:17
Letzteres kommt auf den finalen Aufbau und die Taktrate von G71 an. So wie du es hier darlegst, vermutlich nicht. Jedenfalls nicht von der aritmetischen Leistung. Von der Gesamtleistung ist es fraglich.

Eben doch von der arithmetischen Leistung und dabei ist es auch egal wie man rechnen will.

Angenommen G7x ist nur ein G70 + 2 quads ohne besondere Aenderungen muss ich stets noch bedenken dass jegliche moegliche FLOP-Rate noch von texture OPs beinflusst werden kann. Haben sie jetzt da was geaendert ist es natuerlich wieder eine andere Geschichte. Das Patent das aber ueber andere texture address Methoden spricht klingt mir persoenlich eher nach G80.

Ailuros
2006-01-06, 13:42:36
Viper']G7X @ 600MHZ - erstmal abwarten ;)
Das ist mehr als nur Spekulation

G7x und R580 werden nicht kleiner sein als 380M, wenn nicht sogar 400M oder etwas mehr.

R580 wird fuer 650MHz spekuliert momentan, was ziemlich logisch erscheint; es wuerde mich aber nicht wundern wenn ich sogar hoehere Frequenzen sehen wuerde. Deshalb sagte ich auch dass ich einen neuen Krieg von ueberseltenen und ueberteuerten hoch getakteten GPUs von beiden nicht fuer unwahrscheinlich halte. Wie laecherlich das Ganze ist, ist mir natuerlich schon klar.

robbitop
2006-01-06, 14:03:25
Eben doch von der arithmetischen Leistung und dabei ist es auch egal wie man rechnen will.

Angenommen G7x ist nur ein G70 + 2 quads ohne besondere Aenderungen muss ich stets noch bedenken dass jegliche moegliche FLOP-Rate noch von texture OPs beinflusst werden kann. Haben sie jetzt da was geaendert ist es natuerlich wieder eine andere Geschichte. Das Patent das aber ueber andere texture address Methoden spricht klingt mir persoenlich eher nach G80.
Nein ich meine, dass R580 in diesem Falle G71 leicht aritmetisch überlegen wäre, also ich stimme dir zu.

Gast
2006-01-06, 14:11:23
Jetzt mal ehrlich, der R580 wird nicht viel langsamer sein als der G71. Dann entscheidet für mich die Bildqualität sowie auch HDR+AA. Dann zocke ich Far Cry damit nochmal durch.

Gast
2006-01-06, 16:50:39
Ich schätze der G71 wird schneller. Auf den wart ich erstmal! :(

seahawk
2006-01-06, 17:43:51
Man sollte die ALU Leistung hier nicht überbewerten, zumindest nicht wenn man die zu erwartende Lebensdauer des G70 Refreshes bedenkt. NV läst viel zu oft erkennen, dass der Next-Generation-Chip G80 voll im Zeitplan liegt. Wir reden hier von eime Chip, der wahrscheinlich 1-1,5 Quartale die Speerspitze von NV sein muss. Ob es dann viele Anwendunge gibt, die ein 32 Pipe G70 q 600mhz von der ALU-Leistung her überfordern wage ich mal zu bezweifeln.
Imho dürfte es ein ziemlich ausgeglichenes Rennen werden.

Gast
2006-01-06, 18:20:32
Wieso doppelt? Er zählt pro G70 Pipeline 8x MADs. Bei 2xVec4 ALUs ist das keinesfalls doppelt (da es eben 2xMUL4 oder 1xMUL4 + 1xADD4 oder 1xDP4 +1xMUL4 wären). Oder reden wir hier irgendwie aneinander vorbei?
Anscheinend reden wir hier aneinander vorbei. Hast du Ailuros' Link auf der letzten Seite nicht angeklickt? Dort erklärt er seine Rechnung ziemlich eindeutig. Darin kommt er auf 8 FLOPs pro MADD, zählt diese also, da es Vec4-MADDs sind, quasi doppelt. Ein ADD bewertet er nur mit vier FLOPS, zählt es einfach. Pro ALU kommt er so auf 16 FLOPs für den G70 und 12 für den R520. Der R580 würde hier 36 erreichen (3*8+3*4).

Die acht MADDs pro G70-Pipeline zeigst du mir aber noch, versprochen? *gg*

Dazu müsste man die ALU in 3 Teile aufteilen. Es wäre vieleicht kein Unsinn, aber ich denke, dass es fraglich ist, ob das Kosten/Nutzenverhältnis hier noch stimmen würde.
Oder man zäumt das Pferd gedanklich mal von hinten auf und fängt bei Skalarrechnern an. Was für Splits z.B. der Xenos/C1 kann, ist m.W. nicht geklärt, aber seine ALUs sind jeweils auf die selbe Operationsbreite ausgelegt, wie die Vertexshader der Rxxx-Reihe (Vec4+1). P10 und P20 haben bsw. lediglich einen Pool von Skalarrechnern.

Du nimmst Dinge persönlich und wirst persönlich. Keine gute Ebene für eine Diskussion. Aber dennoch: sorry :)
Akzeptiert. Ich bin mir allerdings nicht sicher, was "persönlicher" ist: Ein globales "Unsinn" vor seinem Post, oder die Bemerkung, dass dies patzig ist. :)

reunion
2006-01-06, 19:00:13
In welchen wäre das? Ich kann mich an diese Zahl gerade nicht erinnern. PDF-Namen und Seitenzahlen genügen, Links brauche ich, glaub' ich, erstmal nicht.

Es wurden im R520-Thread mehrere ATi-Folien der R520-Präsentation gepostet, auf denen hundertprozentig eine Pixelshadergeschwindigkeit von 83GFLOPs angegeben wurde - da dieser Thread die 10.000 Post-Marke überstiegen hat, ist es beinahe unmöglich, diese Dokumente jetzt noch zu finden.

reunion
2006-01-06, 19:04:26
R580 wird fuer 650MHz spekuliert momentan, was ziemlich logisch erscheint; es wuerde mich aber nicht wundern wenn ich sogar hoehere Frequenzen sehen wuerde.

Es werden definitiv 650Mhz für die "XTX", HKEPC hat letztens ein NDA-Dokument veröffentlicht:

http://img512.imageshack.us/img512/2302/ab17f9b28gp.jpg

deekey777
2006-01-06, 19:09:57
Wenn HKEPC das sagt, dann wird's wohl stimmen.

Schon vergessen: http://www.hkepc.com/hwdb/r520firstlook-e.htm?

According to our source, the R520 core is design with 32 pipelines in mind but due to yield problem, not all the pipelines can be utilized. We expect R520 will have 16pp, 24pp and 32pp versions using 90nm micron process technology from TSMC.

Sunrise
2006-01-06, 19:12:18
Es werden definitiv 650Mhz für die "XTX", HKEPC hat letztens ein NDA-Dokument veröffentlicht:
Dessen ist sich Ailuros bewusst, er spricht aber etwas anderes (was ich bei B3D bereits erwähnt hatte) an.

@Robbitop:
Arithmetisch. Danke.

reunion
2006-01-06, 19:14:23
Dessen ist sich Ailuros bewusst, er spricht aber etwas anderes (was ich bei B3D bereits erwähnt hatte) an.


Darf man auch erfahren, um was es geht?

Sunrise
2006-01-06, 19:16:59
Darf man auch erfahren, um was es geht?http://www.beyond3d.com/forum/showpost.php?p=660600&postcount=387

reunion
2006-01-06, 19:26:41
http://www.beyond3d.com/forum/showpost.php?p=660600&postcount=387

Mhm, das heißt du erwartest noch eine "PE", wenn die Yields besser werden?

reunion
2006-01-06, 19:31:42
Wenn HKEPC das sagt, dann wird's wohl stimmen.

Schon vergessen: http://www.hkepc.com/hwdb/r520firstlook-e.htm?

According to our source, the R520 core is design with 32 pipelines in mind but due to yield problem, not all the pipelines can be utilized. We expect R520 will have 16pp, 24pp and 32pp versions using 90nm micron process technology from TSMC.

Und?
Mir ist durchaus bewusst, dass HKEPC ein Hardwareverständis auf dem Niveau von Fuad hat. Nur ist das ein original ATI-NDA-Dokument, welches HKEPC offensichtlich in die Hände gefallen ist. Die Seite kann noch so wenig Ahnung haben, an den Zahlen ist nicht zu rütteln.

Ailuros
2006-01-06, 19:41:33
Wenn HKEPC das sagt, dann wird's wohl stimmen.

Schon vergessen: http://www.hkepc.com/hwdb/r520firstlook-e.htm?

According to our source, the R520 core is design with 32 pipelines in mind but due to yield problem, not all the pipelines can be utilized. We expect R520 will have 16pp, 24pp and 32pp versions using 90nm micron process technology from TSMC.

*mit dem Kopf gegen die Wand renn*

Ailuros
2006-01-06, 19:46:41
Es werden definitiv 650Mhz für die "XTX", HKEPC hat letztens ein NDA-Dokument veröffentlicht:

http://img512.imageshack.us/img512/2302/ab17f9b28gp.jpg


ATI wuerde liebend gerne wissen wer diesen Hornochsen das Material weiterschleusst. Die 650MHz waren mir schon seit letztem Jahr bewusst und ich bezog mich hauptsaechlich auf die moeglichen Nachschieber.

Ganz nebenbei wird bei B3D von jemand gerade berichtet dass R580 in Fear 1600/4xAA/16xAF 49fps erreichen soll. Besonders viel ist das nicht und das laesst sich locker von einer G7x schlagen ohne verrueckt hohe Taktraten.

Ailuros
2006-01-06, 19:49:24
Mhm, das heißt du erwartest noch eine "PE", wenn die Yields besser werden?

Die Moeglichkeit wuerde ich auf jeden Fall nicht ausschliessen und es haengt eben davon ab (wie immer *seufz*) was G7x genau leisten wird. Fuer R520 die Hersteller dazu zu bringen mit neuen PCBs anzukommen fuer 700MHz war doch etwas zu viel und zu spaet fuer ein Produkt das bald leise verschwinden wird.

reunion
2006-01-06, 19:55:12
Ganz nebenbei wird bei B3D von jemand gerade berichtet dass R580 in Fear 1600/4xAA/16xAF 49fps erreichen soll. Besonders viel ist das nicht und das laesst sich locker von einer G7x schlagen ohne verrueckt hohe Taktraten.

Ja, habs auch schon gesehen.
http://www.beyond3d.com/forum/showpost.php?p=666810&postcount=471

7800GTX512 ave FPS: 36
X1800XT ave FPS: 39
X1900XTX ave FPS: 49

Das sind immerhin (fast) 40% mehr, als die "GTX 512" erreicht, und das trotz eines geringerem Speichertaktes, welcher bei solchen Einstellungen sicherlich nicht unerheblich ist. Mehr war IMHO nicht zu erwarten. Man muss erstmal abwarten, wie sich G71 verhält, immerhin kann man die Speicherbandbreite kaum noch erhöhen.

Sunrise
2006-01-06, 20:03:54
Die Moeglichkeit wuerde ich auf jeden Fall nicht ausschliessen und es haengt eben davon ab (wie immer *seufz*) was G7x genau leisten wird. Fuer R520 die Hersteller dazu zu bringen mit neuen PCBs anzukommen fuer 700MHz war doch etwas zu viel und zu spaet fuer ein Produkt das bald leise verschwinden wird.
Das Thema hatten wir ja schonmal. Die Antwort haben wir, wenn auch indirekt.

PS: http://www.forum-3dcenter.org/vbulletin/showthread.php?p=3490908#post3490908 ;)

Gast
2006-01-06, 20:11:06
Naja gut mit VOLLEM AA und AF und in ner sehr hohen Auflösung aber das kann man mit den meisten CPUs usw. dann eh nicht!
Die Frage ist jetzt nur wann endlich die großen Tests erscheinen? Immerhin gibts schon ein Fear Ergebniss.....

Sunrise
2006-01-06, 20:15:28
Mhm, das heißt du erwartest noch eine "PE", wenn die Yields besser werden?Die Frage ist, ob es Sinn macht. Bei aktueller Ausrichtung, passt eine "PE" zumindest nichtmehr ins Bild.

dr_mordio
2006-01-06, 20:21:27
so jetzt mal butter bei die fische :wink:

wann kommt die x1900xtx nun raus (kaufbar) ?
in einem anderen tread war ja schon der hinweis, das sie in frankreich schon gelistet ist.
kann man tatsächlich noch damit rechnen, das die karte ca. am 26.01.2006 erhälltlich ist????

ich frage, weil ich ein angebot habe, meine sapphire X1800XT-512MB an diesem wochenende nach singapore ausfliegen zu lassen. (käufer ist hier zu besuch und möchte die karte gleich mitnehmen, da sie dort schwer erhälltlich ist)

ich verkauf sie aber nur, wenn ich nicht noch neine ewigkeit ohne graka hier rumsitzen muß.

für tips hier im forum, oder per PN wär ich also sehr dankbar.

MfG
Alex

Ailuros
2006-01-06, 20:25:13
Ja, habs auch schon gesehen.
http://www.beyond3d.com/forum/showpost.php?p=666810&postcount=471

7800GTX512 ave FPS: 36
X1800XT ave FPS: 39
X1900XTX ave FPS: 49

Das sind immerhin (fast) 40% mehr, als die "GTX 512" erreicht, und das trotz eines geringerem Speichertaktes, welcher bei solchen Einstellungen sicherlich nicht unerheblich ist. Mehr war IMHO nicht zu erwarten. Man muss erstmal abwarten, wie sich G71 verhält, immerhin kann man die Speicherbandbreite kaum noch erhöhen.


Uhmmm um 40% zu erreichen reichen 575MHz; die 512GTX hat mehr Bandbreite als sie eigentlich braucht.

Gast
2006-01-06, 20:25:31
Rechne nicht mit einem Release vor Ende Januar. Ob die Karten dann auch verfügbar sind, wird sich zeigen.

Gast
2006-01-06, 20:42:09
Ist das Problem mit FEARs Softshadows in Verbindung mit FSAA eigentlich behoben? Ansonsten würde ich die Benchmarks in "max. Quality" erstmal direkt in die Tonne kloppen.

Ailuros
2006-01-06, 20:44:40
Ist das Problem mit FEARs Softshadows in Verbindung mit FSAA eigentlich behoben? Ansonsten würde ich die Benchmarks in "max. Quality" erstmal direkt in die Tonne kloppen.

Sind die softshadows wirklich den Leistungsverlust wert?

Gast
2006-01-06, 20:49:35
In FEAR finde ich sie häßlich und sie sind es IMO nicht wert. Aber das hat weder Reviewer noch ATi daran gehindert, in der ersten Schockwelle des R520 alles anzuschalten und trotz der (auf allen Karten) daraus resultierenden Bildfehler den Benchmark für gültig zu erklären.

Deshalb interessiert mit, ob diese Werte, die ja offensichtlich mit AA entstanden sind, nun Softshadows an- oder ausgeschaltet hatten.

Weiterhin interessiert mich, ob es dabei immer noch zu Bildfehlern kommt.

robbitop
2006-01-06, 20:56:13
Anscheinend reden wir hier aneinander vorbei. Hast du Ailuros' Link auf der letzten Seite nicht angeklickt? Dort erklärt er seine Rechnung ziemlich eindeutig. Darin kommt er auf 8 FLOPs pro MADD, zählt diese also, da es Vec4-MADDs sind, quasi doppelt. Ein ADD bewertet er nur mit vier FLOPS, zählt es einfach. Pro ALU kommt er so auf 16 FLOPs für den G70 und 12 für den R520. Der R580 würde hier 36 erreichen (3*8+3*4).
Ja aber das ist IMO BS. Eine G70 Pipeline bietet 2x ALUs. Jede verfügt über 4 Kanäele kann also 4x skalare Operationen tätigen. Das wären 8xMADDs. Also entweder 8xMUL1 oder 4xADD1 + 4xMUL1. Das doppelt zu zählen passt nicht, weil's 2 Takte bräuchte. Eine ALU kein keinen MAD pro Takt bringen und überhaupt gibt es AFAIK soeine operation nicht. MAD bedeutet nur, dass die ALU MUL also auch ADD fähig ist (und somit meistens auch DP4).
Die 4x zusätzlichen ADDs beim R5xx sind IMO auch nicht gerechtfertigt. Die kommen nämlich nicht aus der ALU per se sondern aus einer MiniALU. Viel zu restriktiv um jeden Takt ohne weiteres ein ADD4 zu spenden. Das geht nur in Spezialsituationen. Hier hat B3D AFAIK das ganze nicht ganz klar dargestellt.

Ergo: pro Pipeline sollte der G70 8x FLOPs pro Takt können und der R520 4x. (wenn man nicht gerade von spezialfällen ausgeht)


Die acht MADDs pro G70-Pipeline zeigst du mir aber noch, versprochen? *gg*

s.o. Ich finde diese ganze FLOP Rechnung btw sowieso total daneben, da sie kaum etwas aussagt.


Oder man zäumt das Pferd gedanklich mal von hinten auf und fängt bei Skalarrechnern an. Was für Splits z.B. der Xenos/C1 kann, ist m.W. nicht geklärt, aber seine ALUs sind jeweils auf die selbe Operationsbreite ausgelegt, wie die Vertexshader der Rxxx-Reihe (Vec4+1). P10 und P20 haben bsw. lediglich einen Pool von Skalarrechnern.
So ist es ...nur machen die Pxx nicht viel draus. *gg*


Akzeptiert. Ich bin mir allerdings nicht sicher, was "persönlicher" ist: Ein globales "Unsinn" vor seinem Post, oder die Bemerkung, dass dies patzig ist. :)
Sorry, war wirklich nicht böse gemeint. :)
Ich werde mich bessern. (btw es kommt mir vor als seist du bereits hier registriert *gg*)

robbitop
2006-01-06, 21:00:22
@Robbitop:
Arithmetisch. Danke.
Nicht jetzt auch noch du..ein aths reicht. ;)
Trotzdem danke.

Ailuros
2006-01-06, 21:10:35
Ergo: pro Pipeline sollte der G70 8x FLOPs pro Takt können und der R520 4x. (wenn man nicht gerade von spezialfällen ausgeht)

Das ist doch die groesste Albernheit ueberhaupt, denn es gibt 40 GFLOPs fuer R520 und 83 GFLOPs fuer G70@430MHz.

G70 =

1 MADD = 2 FLOPs und ergo 8 MADDs = 16 FLOPs

***edit: 1 MUL gefolgt von 1 ADD Instruktion ergibt 1 MADD was 2 FP32 Operationen gleicht und auf KEINEN Fall einer.

Entweder:

24 * 8 MADDs/clk = 192 MADDs/clk * 0.43 GHz = 82.56 GMADDs * 2 = 165 GFLOPs

Oder:

24 * 16 FLOPs * 0.43 GHz = 165 GFLOPs

robbitop
2006-01-06, 21:13:47
Das ist doch die groesste Albernheit ueberhaupt, denn es gibt 40 GFLOPs fuer R520 und 83 GFLOPs fuer G70@430MHz.

G70 =

1 MADD = 2 FLOPs und ergo 8 MADDs = 16 FLOPs

***edit: 1 MUL gefolgt von 1 ADD Instruktion ergibt 1 MADD was 2 FP32 Operationen gleicht und auf KEINEN Fall einer.

Entweder:

24 * 8 MADDs/clk = 192 MADDs/clk * 0.43 GHz = 82.56 GMADDs * 2 = 165 GFLOPs

Oder:

24 * 16 FLOPs * 0.43 GHz = 165 GFLOPs
Seit wann kann eine G70 Pipeline 16 FLOPs pro Takt berechnen?
Es gibt keine Einheit, die pro Takt ein MUL4+ADD4 raushauen kann und MAD ist keine Operation an sich. Insofern kann ich deine Rechnung nicht nachvollziehen.

Ailuros
2006-01-06, 21:15:19
s.o. Ich finde diese ganze FLOP Rechnung btw sowieso total daneben, da sie kaum etwas aussagt.

Genauso viel wie 24 TMUs * 430MHz = 10.3 GTexels/s. Nur theoretische maximale Zahlen.

Gast
2006-01-06, 21:15:48
Ja aber das ist IMO BS. Eine G70 Pipeline bietet 2x ALUs. Jede verfügt über 4 Kanäele kann also 4x skalare Operationen tätigen. Das wären 8xMADDs. Also entweder 8xMUL1 oder 4xADD1 + 4xMUL1. Das doppelt zu zählen passt nicht, weil's 2 Takte bräuchte. Eine ALU kein keinen MAD pro Takt bringen und überhaupt gibt es AFAIK soeine operation nicht. MAD bedeutet nur, dass die ALU MUL also auch ADD fähig ist (und somit meistens auch DP4).
Die 4x zusätzlichen ADDs beim R5xx sind IMO auch nicht gerechtfertigt. Die kommen nämlich nicht aus der ALU per se sondern aus einer MiniALU. Viel zu restriktiv um jeden Takt ohne weiteres ein ADD4 zu spenden. Das geht nur in Spezialsituationen. Hier hat B3D AFAIK das ganze nicht ganz klar dargestellt.

Ergo: pro Pipeline sollte der G70 8x FLOPs pro Takt können und der R520 4x. (wenn man nicht gerade von spezialfällen ausgeht)

Einverstanden: Eine G70 Pipelines bietet zwei ALUs. Jede verfügt über vier Kanäle.

Nicht einverstanden: Sie kann keine 2*4 Skalar-OPs, sondern nur OPs in 4:0, 3:1 oder 2:2 splitten. Ergo maximal zwei unabhängige Skalar-Ops (wobei dann zwei Kanäle gesamt ungenutzt blieben).

Nicht einverstanden: Das sind keine 8 MADDs. Es sind maximal 4 maximal zweikanalige MADDs. Oder eben eine Mischung aus Skalaren und Vec3-MADDs.

Jede dieser 2*4D-OPs setzt sich jetzt, wie du schon richtig sagtest, aus einem MUL und einem ADD zusammen, muss also doppelt gezählt werden, wenn wir von FLOPs reden wollen, da bereits ein MUL oder ein ADD eine FLOP ist.

Wenn wir es doppelt zählen, haben wir 2 (ALUs) * 2 (MUL+ADD) * 4 (4D-Vector, Splitbarkeit ist bekannt) = 16 (FLOPs).

Beim R520 haben wir dasselbe, nur dass bei der zweiten ALU kein MADD, sondern nur ein 4D-ADD vorkommt. Also insgesamt vier weniger, macht 12.


Natürlich kannst du sagen, dass dieses ADD nicht durchgehend frei nutzbar ist, aber genausowenig ist die SU0 durchgehend und frei verfügbar, weil sie noch zusätzlich mit der Ansteuerung des TAP beschäftigt ist.

Insofern finde ich die FLOP-Geschichte eigentlich gar nicht mal so schlecht.

Gast
2006-01-06, 21:16:44
Toll, vieeeeel zu langsam anscheinend. ;(

Ailuros
2006-01-06, 21:17:02
Seit wann kann eine G70 Pipeline 16 FLOPs pro Takt berechnen?
Es gibt keine Einheit, die pro Takt ein MUL4+ADD4 raushauen kann und MAD ist keine Operation an sich. Insofern kann ich deine Rechnung nicht nachvollziehen.

Seit sie 165GFLOPs erreichen kann. Lies den Mist genauer durch so langsam wird es mehr als nur stoerend.

1 MADD sind 2 FLOPs aus damit.

Sunrise
2006-01-06, 21:18:24
Nicht jetzt auch noch du..ein aths reicht. ;)
Trotzdem danke.Sorry, mir ist das nur schon öfter aufgefallen, da du ja sehr oft mit entsprechendem Vokabular hantierst und das sprang mich jedesmal geradezu an. ;)

robbitop
2006-01-06, 21:25:36
Einverstanden: Eine G70 Pipelines bietet zwei ALUs. Jede verfügt über vier Kanäle.
Jap.


Nicht einverstanden: Sie kann keine 2*4 Skalar-OPs, sondern nur OPs in 4:0, 3:1 oder 2:2 splitten. Ergo maximal zwei unabhängige Skalar-Ops (wobei dann zwei Kanäle gesamt ungenutzt blieben)..
Da erzählst du mir nichts neues. Ich würde auch lieber auf der Vec Ops seite bleiben, da die Kanäle ja nicht von so hoher Granularität sind.


Nicht einverstanden: Das sind keine 8 MADDs. Es sind maximal 4 maximal zweikanalige MADDs. Oder eben eine Mischung aus Skalaren und Vec3-MADDs.
Bin ich mir bewußt, ich nutzte dies um mich mit AiL zu verständigen, der von diesem Kram so viel zu halten scheint.


Jede dieser 2*4D-OPs setzt sich jetzt, wie du schon richtig sagtest, aus einem MUL und einem ADD zusammen, muss also doppelt gezählt werden, wenn wir von FLOPs reden wollen, da bereits ein MUL oder ein ADD eine FLOP ist.
Problem ist nur, dass keine ALU eine MAD Instruktion pro Takt kann. Soetwas gibt es nicht. Entweder ADD oder MUL oder DP. Aber mehr als eine Vec4 geht nunmal pro Takt nicht. Und da es MAD nicht gibt, sinds nur 4 FLOPs.


Wenn wir es doppelt zählen, haben wir 2 (ALUs) * 2 (MUL+ADD) * 4 (4D-Vector, Splitbarkeit ist bekannt) = 16 (FLOPs).
Doppelt zählen ist eben nicht drin, da das keine ALU kann.
s.o.


Beim R520 haben wir dasselbe, nur dass bei der zweiten ALU kein MADD, sondern nur ein 4D-ADD vorkommt. Also insgesamt vier weniger, macht 12.

Schluderei seitens B3D. R5xx besitzt nur eine ALU. Die "zweite" ALU, die hier gezeigt wird, ist eine MiniALU. Diese kann nur äußerst selten ein ADD4 beisteuern. Kann man IMO nicht mitzählen.
Soetwas verwirrt nur. Sonst müßte man ja noch andere Dinge mitzählen wir das NRM_PP ...ect.


Natürlich kannst du sagen, dass dieses ADD nicht durchgehend frei nutzbar ist, aber genausowenig ist die SU0 durchgehend und frei verfügbar, weil sie noch zusätzlich mit der Ansteuerung des TAP beschäftigt ist.
Das ist nicht vergleichbar von der Häufigkeit.
Entweder die Pipeline berechnet Aritmetik oder Texturen. Bei Texturen stallt der aritmetische Teil der Pipeline. Nennt sich Phasenkonzept. Außerdem sind Texturoperationen nur zu jedem zu filterndem Pixel zu fetchen. Das ist einer von vielen Takten. Allerdings ist das eine von vielen Sachen, die die Vergleichbarkeit mittels Rechnungen sabbotiert.
Darum halte ich auch nicht viel von dieser Rechnerei. Nur als grober Indikator.

robbitop
2006-01-06, 21:26:48
Seit sie 165GFLOPs erreichen kann. Lies den Mist genauer durch so langsam wird es mehr als nur stoerend.

1 MADD sind 2 FLOPs aus damit.
Marketingkram. Aber nicht in der Praxis. Dann ist ein DP4 auch 8 FLOPs wert.
Wenn die Diskussion über Technologie dich stört, dann ignoriere mich bitte.