Archiv verlassen und diese Seite im Standarddesign anzeigen : Warum hat der R520 soviel Transistoren?
Weis das jemand von euch?
Quasar
2005-10-12, 12:33:29
Wieso bist du der Meinung, dass es "so viele" sind?
Spasstiger
2005-10-12, 14:17:03
SM3.0 und ausschließlich fp32-Pipelines.
Winkelunabhängiges AF.
Mich wundert es auch. Der NV40 braucht für das gleiche nur 222 Mio.
Wenn man diesen in 90 nm Produzieren würde und dann auf 625Mhz taktet, währe er sicher auch etwa so schnell wie ein R520 XT...
Man müsste mal ne X1800 XL mit 256MB auf 400Mhz Chip- und 550 Ram-Takt runterschrauben und mit ner 6800ultra vergleichen.
Mich würde interessieren welche effizienter ist.
Schließlich sollen die vielen Transistoren für die Effizienz des R520 drauf gegangen sein, oder sind doch pipes abgeschaltet...
Die Menge der Tranisitoren war ein verzweifelter Versuch seitens ATI, die Effiziens und Performance von einem G 70 zu erreichen. Wie man sieht, ist der Versuch absolut misslungen.
Schon die 7800 GTX pättet die neuen Karten von ATI. Glaubt mir, ihr wollt gar nicht wissen, was die bald erscheinende 7800 Ultra mit ihren Konkruenten anstellt...
Dabei ist nVidia sowohl im Single- Karten- Bereich als auch im SLI besser, da schneller und effizienter (Stichwort: Crossfire, 1600 x 1200, 60 Hz Bug).
BvB123
2005-10-12, 14:56:37
Den 60HZ Bug gibt es nur bei X8XX Karten bei der X1K gibt es das problem nichtmehr und bei 1600*1200 sind 120HZ möglich.
Gruß
moeb1us
2005-10-12, 15:12:10
soll das hier ein ati bashing werden oder was? :)
dafür hat der r520 besseres af :tongue:
Hakim
2005-10-12, 15:21:40
Die Anzahl hat mich auch überrascht. Mit besseren AF und einigen neuen features verbraucht man doch net soviel. Bedeutet das eigentlich net das ein evt. g70 mit der 0,9 fertigung etwa genau so takten kann?
betasilie
2005-10-12, 15:35:06
Die Anzahl hat mich auch überrascht. Mit besseren AF und einigen neuen features verbraucht man doch net soviel. Bedeutet das eigentlich net das ein evt. g70 mit der 0,9 fertigung etwa genau so takten kann?
Volles AF verbaucht sehrwohl ein Menge an Transistoren. :nono:
Schon die 7800 GTX pättet die neuen Karten von ATI. Glaubt mir, ihr wollt gar nicht wissen, was die bald erscheinende 7800 Ultra mit ihren Konkruenten anstellt...
Vermutlich das gleiche wie der R580 mit der 7800 GTX... :|
soll das hier ein ati bashing werden oder was? :)
dafür hat der r520 besseres af :tongue:
und besseres AA und AA mit HDR, etc...
SM3.0 und ausschließlich fp32-Pipelines.Eine Pipe zusätzlich FP16-fähig zu machen kostet mehr Transistoren als nur FP32 zu erlauben.
Fetza
2005-10-14, 22:47:23
kommt nicht noch der intelligente speicher controller hinzu? Oder ist der nicht on die?
Gruss
Fetza
So intelligent ist der Speichercontroller gar nicht.
Fetza
2005-10-14, 23:35:49
So intelligent ist der Speichercontroller gar nicht.
aber er verbraucht wenigstens transistoren :-)
die neuen opgengl treiber sollen ihn aber erstmals nutzen, das bringt ja doch scheinbar ordentlich mehr performance.
Volles AF verbaucht sehrwohl ein Menge an Transistoren. :nono:
wohl kaum, wie man am GF3 mit seinen 57Mio. Transistoren sieht.
Fetza
2005-10-15, 03:18:36
wohl kaum, wie man am GF3 mit seinen 57Mio. Transistoren sieht.
Der auch nur ps und vs 1.0 bot :rolleyes:
Fetza
2005-10-15, 04:55:38
1.1.
ups verzeihung, aber der vertex shader war doch 1.0 oder?
Gast2
2005-10-15, 11:13:05
Der auch nur ps und vs 1.0 bot :rolleyes:
ja, aber der r520 hat glaub ich doppelt soviele transistoren wie ein r420 (320 zu 160 Mio. ?). ich glaube auch nicht, daß davon sovile im AF stecken, wenn der Geforce3 insgesamt nur 57Mio. hat, trotz nur shader 1.0.
dilated
2005-10-15, 15:52:36
zum ati nvidia dings sag ich auch mal was:-)))
hab jetzt nicht so die ahnung von allem :p
aber hatte eine 9800pro,und jetzt eine 6600gt (sogar mehr speicher)
aber ich will die 9800pro wiederhaben.
weil
1. die treiber von nvidia so .....(ich mag sie net:)
2. anti aliasing(wo welches,atuner hilft nix entweder 20fps, oder kack quali)
3. Aniso filter (kein vergleich zur 9800pro,einfach schlecht!!!)
4. gesamt stabilität naja
mag an der 6600gt liegen (kleine karte,9800pro groß damals)
ich bin entäuscht auch wenn ich ab un zu mehr fps habe
(ich hätte lieber gute qualität)
hatte auch bei nem kumpel die 6800gt verbaut und kurz getestet, da geht dann wenigstens einigermaßen vernünftiges aa(selbst da hätte ich lieber die 9800 gesehen :p)was nützen mir 160 frames (100 weniger langen auch,wenns dafür dann viel besser aussieht mit ner ewig alten karte :p)
ich spar auf den x1800 :D
so fertig ati/nvidia hehe
ups verzeihung, aber der vertex shader war doch 1.0 oder?Nee. Rampage hätte Pixel- und Vertexshader 1.0 gehabt, GeForce3 kam mit Pixel- und Vertexshader 1.1.
ja, aber der r520 hat glaub ich doppelt soviele transistoren wie ein r420 (320 zu 160 Mio. ?). ich glaube auch nicht, daß davon sovile im AF stecken, wenn der Geforce3 insgesamt nur 57Mio. hat, trotz nur shader 1.0.Die GeForce3 brauchte genau eine Tex-Unit fürs AF (da eine Quadpipe) während R520 immerhin vier Stück braucht (da vier Quadpipes.)
Eine richtig gute AF-Implementierung kostet mal richtig viele Transistoren. So ganz superduper ist das R520-AF aber nicht, ATI hat offenbar Transistoren sparen wollen. Immerhin scheint das 8x AF beinahe auf GF3-Niveau zu sein. Das ist schon mal was. Dazu 6x AAA, und ältere Spiele dürften glänzend aussehen.
GeForce3 hatte Shader 1.1. Der Pixelshader konnte zwar nur 4 Texturen samplen (Rampage: 8) aber dafür konnte man bei GeForce3 4x Tex + 8x Math haben, der Rampage bot nur 8 Ops pro Pixelshader ingesamt. Mit der 1.0-Spec konnte man den Rampage also nicht voll ausnutzen*, die GeForce3-Implementierung wurde wegen der größeren Programmlänge aber als höherwertiger angesehen.
Beim Vertexshader gabs auch was, was der Rampage (genauer, der Sage) nicht konnte.
Dafür hätte man beim Rampage Tex- und Math-Ops vermischen dürfen. Demirug sieht aber auch Nachteile im Rampage-Design, weil während Textursampling die ALUs still gestanden hätten. Für DX8-Spiele sollte das imo nicht groß von Belang sein, die eh praktisch immer stark füllratenlimitiert sind.
Ice =A=
2005-10-15, 20:59:07
Einen direkten Vergleich (wie in den ersten Postings angesprochen) zwischen der R520 und der 7800-Architektur mit gleichem Takt und gleicher Piplineanzahl gibt es übrigens hier:
http://www.driverheaven.net/articles/efficiency/
Die nVidia-Architektur gewinnt, allerdings denkbar knapp. Also quasi Effizienzgleichstand.
Da also das winkelunabhängige AF nur schätzungsweise 20 Millionen Transistoren braucht (hatten wir ja gesagt, weil es in den älteren GeForces drin ist), bleiben noch ca. 50 Millionen bei ATI übrig, die nVidia weniger hat...
P.S.:
Geht vielleicht etwas davon in noch brachliegende Video-Funktionen wie h264-Decoding?
Dass man so viele Transistoren brauchte könnte auch damit zusammenhängen, dass das Design gut taktbar sein soll.
Die Menge der Tranisitoren war ein verzweifelter Versuch seitens ATI, die Effiziens und Performance von einem G 70 zu erreichen. Wie man sieht, ist der Versuch absolut misslungen.
Schon die 7800 GTX pättet die neuen Karten von ATI. Glaubt mir, ihr wollt gar nicht wissen, was die bald erscheinende 7800 Ultra mit ihren Konkruenten anstellt...
Dabei ist nVidia sowohl im Single- Karten- Bereich als auch im SLI besser, da schneller und effizienter (Stichwort: Crossfire, 1600 x 1200, 60 Hz Bug).
erstens ist es nicht "ein versuch", den g70 zu übertrumpfen, da dies ati gelungen ist. zweitens steht einer möglichen 7800 (ultra?) mit 32 pipelines der r580 gegenüber, bei dem ati dank 90 nm-fertigung sowohl mindestens 24 pipes als auch hohen takt realisieren kann. was den 60 hertz-bug mit crossfire der ersten generation angeht: in der 2. generation von crossfire besteht die spezifikation der crossfire-technologie aus 2 dual-link dvi-anschlüssen mit insgesamt max. 120 hertz, sodass auch dieses problem gelöst wurde.
beazel
2005-10-16, 18:55:32
Eine Pipe zusätzlich FP16-fähig zu machen kostet mehr Transistoren als nur FP32 zu erlauben.
nicht nur das, vor allem behauptet ATI das der r520 im FP32-modus genauso bzw. nahezu gleich schnell wie in FP16 arbeitet, da er für FP32 ausgelegt sei.
erstens ist es nicht "ein versuch", den g70 zu übertrumpfen, da dies ati gelungen ist.Ich weiß nicht. Ich würde erstmal Benchmarks gegen eine 512MiB 7800 GTX abwarten.
beazel
2005-10-16, 18:59:28
soll das hier ein ati bashing werden oder was? :)
dafür hat der r520 besseres af :tongue:
und die bessere kantenglättung.
Ich weiß nicht. Ich würde erstmal Benchmarks gegen eine 512MiB 7800 GTX abwarten.
in sachen qualität (AA, gering winkelabhängighes AF in HQ) ist der r520 ja offenbar vorne. ich werd deshalb auf jeden fall von meienre 6800 non-ultra auf die x1800xl upgraden.
So intelligent ist der Speichercontroller gar nicht.
allerdings ist er das. sonszt hätte NV die aufteilung in 8* 32-bit kanäle beim g70 ja auch vornehmen können. hamse aber nicht.
Black-Scorpion
2005-10-16, 19:57:07
erstens ist es nicht "ein versuch", den g70 zu übertrumpfen, da dies ati gelungen ist. zweitens steht einer möglichen 7800 (ultra?) mit 32 pipelines der r580 gegenüber, bei dem ati dank 90 nm-fertigung sowohl mindestens 24 pipes als auch hohen takt realisieren kann. was den 60 hertz-bug mit crossfire der ersten generation angeht: in der 2. generation von crossfire besteht die spezifikation der crossfire-technologie aus 2 dual-link dvi-anschlüssen mit insgesamt max. 120 hertz, sodass auch dieses problem gelöst wurde.
Der R580 hat auch nur 16Pipes.
Wurde im anderen Thread schon oft genug erwähnt. ;)
nicht nur das, vor allem behauptet ATI das der r520 im FP32-modus genauso bzw. nahezu gleich schnell wie in FP16 arbeitet, da er für FP32 ausgelegt sei.Man kann es auch negativ formulieren und sagen, dass der R520 aus FP16 praktisch keinen Gewinn ziehen kann. Aber das scheint auch gar nicht nötig, da der R520 schnell genug ist – trotz unterlegener Rechenleistung. Dank dem so genannten Threading können die Rechenwerke sehr gut ausgenutzt werden und von der vorhandenen Rechenleistung kommt mehr beim User an. Wenn ATI also im R580 tatsächlich 48 solcher ALUs (also 12 Quadshadercores) bringt, sehe ich schwarz für Nvidia. Den R580 – so die Spekulation bezüglich der arithmetischen Leistung stimmt – mit CineFX zu schlagen, halte ich für kaum möglich.
Man korrigiere mich, wenn ich falsch liege, aber so wie ich das sehe, kann ATI schön einfach skalieren und braucht nur ein paar neue Shadercores einbauen, und hat einen G70-Killer. Das "Killer-Feature" namens Transparenz-AA bietet R300+ auch, dazu kommt ab R520 das überlegene AF.
(del)
2005-10-16, 21:53:20
Dass man so viele Transistoren brauchte könnte auch damit zusammenhängen, dass das Design gut taktbar sein soll.
Ich nehme an, daß Speicher ebenfalls immernoch aus Transistoren gebastelt wird. Kann also noch sein, daß der Chip mit viel mehr bzw. größeren Caches/Zwischenspeicher/Puffern/was auch immer ausgestattet wurde.
Das könnte sein, ist aber nicht gerade wahrscheinlich.
Man darf nicht einfach so bei den Pipes die Anzahl "16" nehmen und sich wundern, wieso der R520 doppelt so viele Transistoren verbraucht wie der R420. Eine FP32-Pipe nimmt ungefähr 50% mehr Transistoren ein als eine FP24-Pipe. Dazu kommt, dass der R520 bestimmte spezielle Funktionen (darunter SINCOS) jetzt über eine interne Tabelle direkt berechnen kann dafür und nicht mehr 8 Takte braucht, wie noch der R420.
Das könnte sein, ist aber nicht gerade wahrscheinlich.
Man darf nicht einfach so bei den Pipes die Anzahl "16" nehmen und sich wundern, wieso der R520 doppelt so viele Transistoren verbraucht wie der R420. Eine FP32-Pipe nimmt ungefähr 50% mehr Transistoren ein als eine FP24-Pipe. Dazu kommt, dass der R520 bestimmte spezielle Funktionen (darunter SINCOS) jetzt über eine interne Tabelle direkt berechnen kann dafür und nicht mehr 8 Takte braucht, wie noch der R420.
wird der r520 wirklich 16 pipes haben oder ist das nur wieder eine dieser DAUigen schätzungen? warum sollte ati jetzt schon die pipelineanzahl des r520 publik machen??
wird der r520 wirklich 16 pipes haben oder ist das nur wieder eine dieser DAUigen schätzungen? warum sollte ati jetzt schon die pipelineanzahl des r520 publik machen??
Der R580 (den meinst du doch?) wird 16 Pipes mit 3 ALUs je Pipe haben.
Praktisch ein RV530 x4. :)
Falls du den R520 meinst, warum "wird"? Ist doch schon erhältlich und hat 16 Pipes. ;)
reunion
2005-10-19, 20:22:54
Ich weiß nicht. Ich würde erstmal Benchmarks gegen eine 512MiB 7800 GTX abwarten.
Ist es wirklich von Relevanz, welcher Chip de facto eine hauchdünnen Vorsprung haben wird?
Im Endeffekt wird es höchstwarscheindlich auf einen Patt hinauslaufen, bei dem je nach Spiel mal die Eine, und mal die Andere Karte vorne liegt. Doch R520 bietet einen IQ, die man mit G70 schlicht nicht erreichen kann, und das wiegt IMHO wesentlich höher als das letzte Prozent Performance.
reunion
2005-10-19, 20:28:23
Der R580 hat auch nur 16Pipes.
Wurde im anderen Thread schon oft genug erwähnt. ;)
Man sollte mit dem Begriff "Pipeline" vorsichtig sein, denn Pipeline ist eben nicht gleich Pipeline.
R580 wird zwar nur 16 TMUs haben, aber 48ALUs, und da diese im Gegensatz zum G70 parallel geschaltete sind, könnte man genauso von 64 Pipelines sprechen.
reunion
2005-10-19, 20:32:34
GeForce3 hatte Shader 1.1. Der Pixelshader konnte zwar nur 4 Texturen samplen (Rampage: 8) aber dafür konnte man bei GeForce3 4x Tex + 8x Math haben, der Rampage bot nur 8 Ops pro Pixelshader ingesamt. Mit der 1.0-Spec konnte man den Rampage also nicht voll ausnutzen*, die GeForce3-Implementierung wurde wegen der größeren Programmlänge aber als höherwertiger angesehen.
Beim Vertexshader gabs auch was, was der Rampage (genauer, der Sage) nicht konnte.
Dafür hätte man beim Rampage Tex- und Math-Ops vermischen dürfen. Demirug sieht aber auch Nachteile im Rampage-Design, weil während Textursampling die ALUs still gestanden hätten. Für DX8-Spiele sollte das imo nicht groß von Belang sein, die eh praktisch immer stark füllratenlimitiert sind.
Rampage wäre zwar in punkto Shader leicht zurückgelegen, doch bot Rampage noch andere, wesentlich wichtigere Dinge. Er unterstützte bis zu 4xRGMSAA, dass nV erst mit dem NV40(!) einführte, bis zu 16xAF, und wäre zumindest in der SLI-Variante auch leistungsmäßig gut dagestanden IMO.
Black-Scorpion
2005-10-19, 20:49:50
Man sollte mit dem Begriff "Pipeline" vorsichtig sein, denn Pipeline ist eben nicht gleich Pipeline.
R580 wird zwar nur 16 TMUs haben, aber 48ALUs, und da diese im Gegensatz zum G70 parallel geschaltete sind, könnte man genauso von 64 Pipelines sprechen.
Es ging auch nur um die üblichen 24Pipes beim R580.
Und da es nur 4 Quads sind, ändert das ja erstmal nichts oder doch?
Dunkeltier
2005-10-20, 05:02:13
Dass man so viele Transistoren brauchte könnte auch damit zusammenhängen, dass das Design gut taktbar sein soll.
Wie die Kyro II im Vergleich zur Kyro I, welche auch ein paar Extra-Transistoren verpaßt bekam um besser taktbar zu sein... :rolleyes:
wird der r520 wirklich 16 pipes haben oder ist das nur wieder eine dieser DAUigen schätzungen? warum sollte ati jetzt schon die pipelineanzahl des r520 publik machen??Wie viele Pipes der R580 haben wird, weiß ich nicht. Es gibt Spekulationen dass er 16 TMUs und 48 ALUs haben könnte. Das halte ich für nicht unvorstellbar, aber wissen tu ich da nichts.
Welche ALUs werden denn wohl verdreifacht?
Alle "5", die ATi angibt oder vielleicht nur die MADD-Einheit, während ADD vielleicht erstmal ganz wegfällt. Dann bräuchte man "nur" aus der ADD-Einheit eine MADD zu machen und noch eine MADD hinzufügen. Das klänge machbar und sinnvoll.
Alle ALUs, immer im Pack. Aus der ADD-Einheit gleich eine MAD-Einheit zu machen ist wenig sinnvoll, weil man dann wieder neue Mini-ALUs bräuchte. Der Vorteil solcher kleinen ALUs à la R300/R420/R520 ist die feine Granularität. Bei größeren ALUs à la G70 ist es schwieriger, jene voll ausnutzen.
Ein 1:3 TMU:ALU-Verhältnis empfinde ich als sinnvoll. Bei CineFX müsste man dann also noch ein drittes MAD in die Pipe packen. Damit sinkt die Möglichkeit der Auslastung noch mehr. Deshalb ist es bei CineFX auch sinnvoller, es bei 1:2 zu belassen und die ALU-Leistung über die Zahl der Pipelines zu holen. Falls es noch zu einem weiteren CineFX-Aufguss kommt, hoffe ich dass endlich mal die Zahl der physikalischen Temps auf mindestens 6, besser 8 angehoben wird.
Der R580 (den meinst du doch?) wird 16 Pipes mit 3 ALUs je Pipe haben.
Praktisch ein RV530 x4. :)
Falls du den R520 meinst, warum "wird"? Ist doch schon erhältlich und hat 16 Pipes. ;)
natürlich r580. leicht verschrieben
vBulletin®, Copyright ©2000-2025, Jelsoft Enterprises Ltd.