PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Athlon FX Single Channel Benchmarks anywhere?


darkvader
2004-02-06, 17:48:22
Da ich mir gerade die Frage stelle, wieviel Mehrleistung wir vom Dual Channel Athlon 64 erwarten können, wollte ich als Anhaltspunkt mal schauen, wieviel % Leistungszuwachs der FX aus einem zweiten Modul zieht - daher meine Frage, gibt es irgendwo Benchmarks, wo der FX mit zwei und zum Vergleich mit einem Modul als "single" Variante gebencht wurde?
Hab bei Tomshardware oder computerbase nix gefunden.... :-(

Tigerchen
2004-02-06, 17:56:53
Die neuen Athlon64 Mainboards mit Sockel 939 haben nicht nur Dual Channel sie bieten auch einen beschleunigten Hypertransport und brauchen keinen reg. Speicher. Das sind alles zusammen so gravierende Änderungen daß man von der Athlon FX Dual-Channel Performance überhaupt nicht auf die Dualchannel Performance beim kommenden Athlon64 im Sockel 939 schließen kann. Also abwarten und Tee trinken.:)

Endorphine
2004-02-06, 17:59:39
Lese einfach einen beliebigen Test, in dem Athlon-64 3400+ und Athlon-64 FX51 gegeneinander antreten (gleiche Cachegrösse, gleicher Kerntakt). Für den Sockel 939 kannst du dir dann noch einen Leistungsgewinn im Bereich von schätzungsweise einem Zehntelpromille dazudenken, weil der zusätzliche Takt Latenz durch den gepufferten Speicher bei der Sockel 939-Plattform wegfällt.

Aceshardware ist grade down, dort solltest du aber iirc entsprechendes finden.

Endorphine
2004-02-06, 18:02:06
Original geschrieben von Tigerchen
Die neuen Athlon64 Mainboards mit Sockel 939 haben nicht nur Dual Channel sie bieten auch einen beschleunigten Hypertransport und brauchen keinen reg. Speicher. Das sind alles zusammen so gravierende Änderungen daß man von der Athlon FX Dual-Channel Performance überhaupt nicht auf die Dualchannel Performance beim kommenden Athlon64 im Sockel 939 schließen kann. Also abwarten und Tee trinken.:) Ja, die Änderungen sind so gravierend im Vergleich zum Sockel-940 Opteron, dass Leistungsgewinne im Bereich von 0,00000000001 - 0,000000000011 % erwartet werden. Ganz neue Leistungshorizonte eröffnen sich dem Käufer.

StefanV
2004-02-06, 18:03:17
Original geschrieben von Endorphine
Ja, die Änderungen sind so gravierend im Vergleich zum Sockel-940 Opteron, dass Leistungsgewinne im Bereich von 0,00000000001 - 0,000000000011 % erwartet werden. Ganz neue Leistungshorizonte eröffnen sich dem Käufer.

Naja, 1-2% kann man ev. schon erwarten :>

Endorphine
2004-02-06, 18:17:28
Original geschrieben von Stefan Payne
Naja, 1-2% kann man ev. schon erwarten :> In Anwendungen? Sorry, aber das ist komplett unrealistisch.

Wenn von rund 200 Takten Latenz beim Speicherzugriff (Aceshardware ist down, hab keine genauen Werte im Kopf) einer dem Register auf den Speichermodulen zuzurechnen ist und gleichzeitig die Bandbreite des Hypertransport nicht einmal ansatzweise ausgeschöpft wird in der Realität niemals ein Leistungssprung ausserhalb der Messungenauigkeit in Anwendungen ankommen.

Sorry, aber das ist Wunschdenken. In der Praxis ist der Unterschied zwischen dem A64-FX und gleich taktendem und mit gleicher Cachegrösse ausgestattetem Sockel-754 Athlon-64 auch gerade mal mess-, aber nicht spürbar.

Tigerchen
2004-02-06, 18:58:17
Original geschrieben von Endorphine
In Anwendungen? Sorry, aber das ist komplett unrealistisch.

Wenn von rund 200 Takten Latenz beim Speicherzugriff (Aceshardware ist down, hab keine genauen Werte im Kopf) einer dem Register auf den Speichermodulen zuzurechnen ist und gleichzeitig die Bandbreite des Hypertransport nicht einmal ansatzweise ausgeschöpft wird in der Realität niemals ein Leistungssprung ausserhalb der Messungenauigkeit in Anwendungen ankommen.

Sorry, aber das ist Wunschdenken. In der Praxis ist der Unterschied zwischen dem A64-FX und gleich taktendem und mit gleicher Cachegrösse ausgestattetem Sockel-754 Athlon-64 auch gerade mal mess-, aber nicht spürbar.

Ach Mensch. Was meinste wohl warum ich abwarten und Tee trinken dazu geschrieben habe?

Mit deinen Voraussagen liegst du ja oft daneben. Würde mich nicht wundern wenns diesmal wieder so ist. Nun wie gesagt. warten wirs ab. Ist ja nicht mehr soooooo lange hin.

Gast
2004-02-06, 19:01:47
Der Vergleich FX DC vs FX SC macht daher Sinn, da der Reg RAM keinen Einfluss hat wie bei A64 3400 vs A64 FX - 51.
Ich glaube, bei x-bit mal was von knapp über 100 Takten Speicherlatenz gelesen zu haben...:up:
1-2% Mehrleistung gibt es vielleicht bei "ausgesuchten" Benchmarks.;)

Endorphine
2004-02-06, 19:02:45
Edit: Keine Lust mehr auf den Kindergarten...

mrdigital
2004-02-06, 19:07:23
beziehen sich die 100 Takte Latenz auf 100 externe (Ram) Takte oder 100T CPU-Kern Takte, der 1 Takt extra (beim reg. RAM) wären ja 10 CPU-Kerntakte (bei 200MHZ Ram und 2GHz CPU-Kern).

Gast
2004-02-06, 19:11:20
Original geschrieben von darkvader
Da ich mir gerade die Frage stelle, wieviel Mehrleistung wir vom Dual Channel Athlon 64 erwarten können, wollte ich als Anhaltspunkt mal schauen, wieviel % Leistungszuwachs der FX aus einem zweiten Modul zieht - daher meine Frage, gibt es irgendwo Benchmarks, wo der FX mit zwei und zum Vergleich mit einem Modul als "single" Variante gebencht wurde?
Hab bei Tomshardware oder computerbase nix gefunden.... :-( Dual Channel und der halbierte L2 Cache gleichen sich etwa aus.Der Unterschied ist etwa so gross wie zwischen A64 3000+ und A64 3200+.
www.hardtecs4u.com/reviews/2003/amd_athlon64/

Endorphine
2004-02-06, 19:11:44
Original geschrieben von mrdigital
beziehen sich die 100 Takte Latenz auf 100 externe (Ram) Takte oder 100T CPU-Kern Takte, der 1 Takt extra (beim reg. RAM) wären ja 10 CPU-Kerntakte (bei 200MHZ Ram und 2GHz CPU-Kern). CPU-Takte natürlich. Der Timer (TSC, time stamp counter) sitzt in der CPU.

Gast
2004-02-06, 19:14:42
Original geschrieben von mrdigital
beziehen sich die 100 Takte Latenz auf 100 externe (Ram) Takte oder 100T CPU-Kern Takte, der 1 Takt extra (beim reg. RAM) wären ja 10 CPU-Kerntakte (bei 200MHZ Ram und 2GHz CPU-Kern).
Die knapp über 100 Takte bezogen sich auf die CPU.
War allerdings ein recht niedrig getaktetes Vorserienmodel mit schnellen, ungepufferten Speicher.

mrdigital
2004-02-06, 19:18:19
na dann macht der eine Takte mehr Latenz im reg Speicher ja doch schon 10 Kerntakte aus, ich denke schon, dass man diesen Effekt dann auch Messen und sehen kann. Er wird aber sicher nicht dramatisch sein aber schon mehr als die 0,000001%, meinste nicht Endorphine? ;)

Tigerchen
2004-02-06, 19:19:17
Original geschrieben von Endorphine
Ich weiss es nicht. Weil du wieder mal 'rumflamen willst? Das sind keine Voraussagen, das sind (wenn auch für dich bittere) Fakten. Wo kein Flaschenhals, da ist auch nichts durch noch mehr I/O-Leistung herauszuholen. Und wenn das Pufferregister auf den Modulen lediglich einen Takt zusätzliche Latenz bringt wird der Unterschied nur mit Mühe überhaupt messbar sein. Aber du weisst ja ohnehin alles besser.


Ich denke mal daß du erheblich mehr Flammen hochzüngeln läßt als ich. Ich mach das nur wenn ich ne halbe Seite "Intelwerbung pur" lesen muß.

In der Regel weißt du viiiiieel mehr über Computerinterna als ich. Aber nicht jeder Wunsch den du hier äußerst ist realistisch. Aber wir kommen schon wieder vom Thema ab.

Fakt ist daß ich nur meine bescheidene Meinung zu dem Thema abgegeben habe. Und Meinungen wollte darkvader ja hören.

Gast
2004-02-06, 19:24:02
Es waren 96!!! Takte bei 1,6Ghz:
www.xbitlabs.com/articles/cpu/display/athlon64_6.html

Bokill
2004-02-06, 19:53:40
Da könnten Benches drin sein, allerdings ist wirklich noch keine korrekte Aussage machbar.

Inhaltsverzeichnis Benchmarkmärchen mit Fortsetzung (http://www.planet3dnow.de/vbulletin/showthread.php3?s=&threadid=137038)

Dort allerdings bekommt man eine Ahnung, wie stark die Unterschiede sein könnten (Nicht wirklich fett, dies hängt dann extrem von der Art des Benchmarks ab)
Erster systematischer Bench Opteron? Singel/Dual Channel Speicherinterface! (http://www.planet3dnow.de/vbulletin/showthread.php3?s=&threadid=109550)

Der Sockel 939 wird sicherlich noch einen guten Schub dadurch bekommen, dass die verbesserten Latenzen der Ungepufferten/Registered Soeicherriegel durchschlagen. Aber der Gewinn dadurch wird irgendwo zwischen 0-10 % liegen.

Der Effekt von einem einzel Hammer mit beschleunigtem HTr-Link wird vermutlich viel geringer durchschlagen, als die durchgepusteten Speicherriegel.
Bei dual Opteronen oder noch mehr Opteronen wird ein beschleunigter HTr-Link aber deutlich besser durchschlagen.

Dass ein Intelfanboy seine Wünsche irgendwo bei 0,000001 % ansiedelt ist sicher aus der Kiste Retorik...

Seine Befürchtungen dürften deutlich höher liegen, meiner Meinung nach ist die Beschleunigung aber dennoch für Normanwender recht belanglos.

Bei Spezialanwendungen und viel höheren Taktfrequenzen (des Hammers) kann dies dann aber ganz anders aussehen.

Dualchannel ist aber ein nettes Zusatzfeature für die Zukunft :)

PS: Wenn schon bei einem Hammer eine Systemverbindungstakterhöhung sooooo schlecht ausfällt , was soll denn Intel mit ihrem altbackenem Buskonzept machen? (Pentium4, "Centrino", Itani(c)um) ;)

Aufgeben ? ! ? ;)

MFG Bokill

Avalox
2004-02-06, 20:59:13
Den beschleunigten HTr wird man nicht spürbar merken. Denn bei den jetzigen Übertakteten HTr Links merkt man es auch nicht.

Der halbe Cache wird mitunter spürbar sein. In der Leistung und hoffentlich auch im Geldbeutel :)

Der Dual Channel Controller wird offensichtlich überschätzt. Viele vergessen dabei auch, dass der Athlon64 z.Z. den schnellsten Memory Controller hat. Also ein Teil des früheren Speicherengpasses schon dadurch kompensiert werden.
Es gibt durchaus Athlon FX Benchmarks, welche mit schnellen Reg. Ram (z.B. http://www.corsairmemory.com/corsair/products/specs/twinx1024re-3200ll.pdf) durchgeführt worden. Unterschiede sah man ausschliesslich in synthetischen Benchmarks, da allerdings sehr deutlich.
Auch der Dual Channel Controller ist der schnellste, jemals in einem x86 System eingesetzte.

Mein Tipp: Die Sockel 939 CPUs werden im Grunde ein wenig langsamer sein, dafür deutlich günstiger.

Vergessen tun auch mansche, dass AMD nicht nur Cache mit den Memory Channels in Beziehung bringt, sondern dieses auch mit dem CPU Takt tut. z.Z. entspricht 512KB L2 Cache, Dual Mem. Channel und 200MHz mehr Takt eine Erhöhung im P Rating von 200.

Gast
2004-02-06, 23:14:16
Das die echten Newcastles/Winchesters für AMD und hoffentlich auch für den Kunden billiger sein sollten ist mehr als warscheinlich, jedoch sind DC Syteme aufgrund mehrerer Speicher Riegel auch ein wenig teuerer. Der Cache wird nicht so sehr ins Gewicht fallen(Siehe 3200+ vs 3000+), der Spiechercontroller wird dank höherer Bandbreite und besserer Latenzen den L2 Cache mehr als ausgleichen, interessant wäre es, wenn Anwendungen auf 1MB L2 Cache Peozzeren optimiert sind.

@Bokill: Der FSB von Intel limitiert das System weitaus mehr als AMDs HTr, der keine Daten zwichen Speicher und Prozzessor transportieren muss.

Bokill
2004-02-07, 07:27:50
@Gast


Der FSB von Intel limitiert das System weitaus mehr als AMDs HTr, der keine Daten zwischen Speicher und Prozzessor transportieren muss.

Ich weiss... aber in der Regel fallen mein Provokationen anders aus als

"Boah Ehy AMD SUCKs Alter Öhy"

und Endo beherrscht vorzüglich die verschiedensten Spielarten der Provokation aber auch der Information...

Hin und wieder könnte ich ihn an die Wand klatschen, bei anderen Sachen ist er aber derartig Kompetent und zugleich Neutral, dass er eine vorzügliche Bereicherung für jedes Forum ist ;)

Habe da ja "Zufällig" da so n Artikel auf P3D geschrieben,...
Der Hypertransportlink; AMD’s Unabhängigkeits...

MFG Bokill

Gast
2004-02-07, 11:04:45
Der Dual Channel bringt leider wirklich so gut wie nix beim A64. Ein A64 Sockel 754 wird bei gleicher Taktrate mit 90% Warscheinlichgkeit in 90% aller Benches schneller sein (wegen 1 MB Level 2 gegen 512k) hrhr. Für Overclocker ist die Dual Plattform allerdings net schlecht da ein mit 300 MHZ Referenztakt und 200MHZ Speichertakt getakteter A64 weitaus mehr vom Dual Channel Interface profitieren wird als ein Normalgetakteter. Wer weiss vielleicht steigert ja AMD beim 3700 den Referenztakt.

CrazyIvan
2004-02-07, 12:58:24
*LOL*

Und aus welchem Grund sollten die das machen?
Der Referenz - Takt hat keinerlei Einfluss auf die Performance des Systems.
Er ist, wie der Name schon sagt, nur eine Referenz - aus ihm bilden alle anderen Komponenten per Multi ihren Takt.

Im Klartext:
Da der Referenztakt rein gar nix mit jedweder Datenübertragung innerhalb des Systems zu tun hat - anders als der frühere FSB - ändert sich auch durch dessen Anhebung absolut nix, sofern man für die restlichen Komponenten passende Multis hat.

mrdigital
2004-02-07, 13:16:21
ich kann mir vorstellen, das der A64 sein Dualchannel Speicherinterface erst mit 64bit Applikationen ausspielen kann, da erst dann der Datendurchsatz steigt und erst so der die grössere Bandbreite genutzt wird.

GloomY
2004-02-07, 14:12:10
Original geschrieben von Gast
Der Vergleich FX DC vs FX SC macht daher Sinn, da der Reg RAM keinen Einfluss hat wie bei A64 3400 vs A64 FX - 51.Warum bencht man nicht einfach gegen einen Athlon 64 3400+, der eine Command Rate von zwei Takten eingestellt hat? Nichts leichter als das...
Original geschrieben von mrdigital
na dann macht der eine Takte mehr Latenz im reg Speicher ja doch schon 10 Kerntakte aus, ich denke schon, dass man diesen Effekt dann auch Messen und sehen kann. Er wird aber sicher nicht dramatisch sein aber schon mehr als die 0,000001%, meinste nicht Endorphine? ;) Das denke ich auch.Original geschrieben von Avalox
Den beschleunigten HTr wird man nicht spürbar merken. Denn bei den jetzigen Übertakteten HTr Links merkt man es auch nicht.Man merkt den Unterschied der Geschwindigkeit der HT-Kanäle vor allem bei Multiprozessorsystemen. Da kommt es nämlich wirklich drauf an, großen Datenmengen (Cache Lines, I/O Daten eines Prozessors ohne I/O Anbindung an einen mit I/O) zu übertragen, wobei die Latenz hier auch ziemlich wichtig ist. Höherer Takt hilft hier definitiv mehr als nur bei einem Einprozessorsystem, bei dem HT nur zu I/O Zwecken gebraucht wird und nicht zur Kommunikation der Prozessoren untereinander.
Original geschrieben von mrdigital
ich kann mir vorstellen, das der A64 sein Dualchannel Speicherinterface erst mit 64bit Applikationen ausspielen kann, da erst dann der Datendurchsatz steigt und erst so der die grössere Bandbreite genutzt wird. Ich schätze mal, dass sich nicht so viel ändern wird. 64 ist zwar das Doppelte von 32, aber so einfach ist die Rechnung nun auch nicht ;) Der Code wird nicht viel größer (10% maximal?) und die Daten? Bei FP tut sich ja sowieso nichts, bei Integer gibt's ja immer noch die Möglichkeit, auch kleinere Datentypen zu benutzen, wenn man nicht die vollen 64 Bit braucht. (short bzw. byte)

Klar wird da der Bandbreitenverbrauch zunehmen, aber ich schätze mal dass sich dies durchschnittlich betrachtet im Bereich von +10% bis +30% bewegen wird.

Gast
2004-02-07, 14:22:07
Original geschrieben von Bokill
@Gast


Ich weiss... aber in der Regel fallen mein Provokationen anders aus als

"Boah Ehy AMD SUCKs Alter Öhy"

und Endo beherrscht vorzüglich die verschiedensten Spielarten der Provokation aber auch der Information...

Hin und wieder könnte ich ihn an die Wand klatschen, bei anderen Sachen ist er aber derartig Kompetent und zugleich Neutral, dass er eine vorzügliche Bereicherung für jedes Forum ist ;)

Habe da ja "Zufällig" da so n Artikel auf P3D geschrieben,...
Der Hypertransportlink; AMD’s Unabhängigkeits...

MFG Bokill
Ich hatte "Zufällig" den durchaus gelungen Artikel gelesen bevor dieser Tread gestartet wurde und hab mir auch gedacht, dass du Ahnung von dem hast, was du postest.
Ich wollte nur verhindern, dass es zu einer Fehlinterpretation kommt.;)
Original geschrieben von mrdigital
ich kann mir vorstellen, das der A64 sein Dualchannel Speicherinterface erst mit 64bit Applikationen ausspielen kann, da erst dann der Datendurchsatz steigt und erst so der die grössere Bandbreite genutzt wird.
Warscheinlich steigen sowohl die Nutzbarkeit von 1MB L2 Cache als auch des Dual Channel Interfaces.

Gast
2004-02-07, 14:28:42
Original geschrieben von GloomY
Warum bencht man nicht einfach gegen einen Athlon 64 3400+, der eine Command Rate von zwei Takten eingestellt hat? Nichts leichter als das...

Würde sich die Latenz dann um 2 Speichertakte erhöhen?
Falls ja, dann wäre es sicher eine gute Möglichkeit, aber vielleicht könntest du deinen Post noch einmal für non CPU-Guros erklären.;)

mrdigital
2004-02-07, 15:26:01
Original geschrieben von GloomY
...
Ich schätze mal, dass sich nicht so viel ändern wird. 64 ist zwar das Doppelte von 32, aber so einfach ist die Rechnung nun auch nicht ;) Der Code wird nicht viel größer (10% maximal?) und die Daten? Bei FP tut sich ja sowieso nichts, bei Integer gibt's ja immer noch die Möglichkeit, auch kleinere Datentypen zu benutzen, wenn man nicht die vollen 64 Bit braucht. (short bzw. byte)

Klar wird da der Bandbreitenverbrauch zunehmen, aber ich schätze mal dass sich dies durchschnittlich betrachtet im Bereich von +10% bis +30% bewegen wird.

jo so um 10-30% würde ich das auch sehen, aber dafür gibts ja dann auch ein DC Speicher, damit der A64 im 64bit Modus eben nicht vom SC Speicher gebremst wird.

GloomY
2004-02-07, 15:51:30
Original geschrieben von Gast
Würde sich die Latenz dann um 2 Speichertakte erhöhen?Nein, um einen.
Original geschrieben von Gast
Falls ja, dann wäre es sicher eine gute Möglichkeit, aber vielleicht könntest du deinen Post noch einmal für non CPU-Guros erklären.;) Die Command Rate (auch DRAM Command Latency genannt) setzt sich aus zwei Dingen zusammen: Das eine ist die Zeit, die der Speichercontroller braucht, um festzustellen, in welcher Row sich eine Adresse befindet. Die zweite Verzögerug ist das letztliche Aktivieren dieser gewählten Row, also dem Speicherchip das richtige Signal auf der CS Leitung zu schicken.
Wenn das geschehen ist, kann anschliessend mit ACTIVE und READ/WRITE Commands (Zeile und Spalte adressieren) auf die einzelnen Speicherzellen zugegriffen werden.

Die Command Rate beträgt im Normalfall einen Takt. Je mehr Rows man verbaut hat, desto länger dauert der Auswahlvorgang des Speichercontrollers (mehr Möglichkeiten), daher muss man oftmals bei einem voll mit Speicher bestückten System diese auf zwei Takte erhöhen.
Wenn man nur eine Row hat (also ein "einseitiges" Modul), geht die Auswahl des Speichercontrollers zwar sehr schnell (es gibt ja nur eine Row), aber das Aktivieren dieser Row braucht ja immer noch selbst Zeit. Daher kann man selbst in diesem Fall keine Null Takte Command Rate benutzen.

Jetzt zu Registered Speichermodulen:
Diese besitzen ein paar Register auf dem Modul selbst, welche zwischen Controller und Speicher sitzen. Der Controller adressiert immer nur die Register und diese geben die Signale dann an die Speicherchips weiter. Das hat den Vorteil, dass die Register nun die benötigte Treiberleistung des Chipsatzes verringern, da sie selbst die eigentliche Adressierung übernehmen. Damit kann man insgesamt mehr Rows und damit mehr Speicher stabil im System betreiben. Daher brauchen fast alle Server reg. Speicher, da diese auf großen Speicherausbau angewiesen sind.

Die Weitergabe der Adressen (und Steuersignale) des Registers an die Chips hat aber den Nachteil, dass es eine Verzögerung im Gegensatz zum direkten Ansprechen bei nicht reg. Speicher gibt. Bei Adressen ist das recht unkritisch, nicht aber bei dem (durch den Chipsatz) schon verzögerten CS Signal. Das führt dazu, dass reg. Speicher immer eine Command Rate von 2 Takten benötigt.

Im Normalfall ist das langsamer als bei nicht reg. Speicher, der nur einen Takt dafür braucht. Viele BIOSe bieten aber auch die Auswahl der Command Rate an, somit kann man das Verhalten von reg. Speicher quasie simulieren. :)

Noch ein Wort zur Performance: Die Command Rate wird immer nur dann gebraucht, wenn eine andere Row adressiert wird. Das ist bei Random Access deutlich häufiger der Fall als bei Burst Zugriffen. Das heisst also, dass bei Streaming Anwendungen reg. Speicher fast so schnell wie nicht gepufferter Speicher ist, jedoch bei zufälligen Zugriffen einen Speichertakt langsamer arbeitet.
Original geschrieben von mrdigital
jo so um 10-30% würde ich das auch sehen, aber dafür gibts ja dann auch ein DC Speicher, damit der A64 im 64bit Modus eben nicht vom SC Speicher gebremst wird. Die Zeiten sind beim Athlon vorbei, wo er bandbreitenlimitiert war. Zumindest mit den jetztigen Cachelines und der Speicherbandbreite ist man weit davon entfernt. D.h. dass selbst auf einem Single Channel Speicherinterface 64 Bit gut performen wird. =)