Anmelden

Archiv verlassen und diese Seite im Standarddesign anzeigen : AMD - Shanghai - Opteron


AnarchX
2008-11-13, 08:21:45
http://img243.imageshack.us/img243/4725/21569b8c54124edfb346376ji6.jpg (http://imageshack.us)


Testberichte/ Architekturbetrachtungen:
http://www.pcgameshardware.de/?article_id=666774&page=1
http://www.tecchannel.de/server/prozessoren/1776972/test_amd_opteron_2384_cpu_benchmarks_performance_shanghai/
http://www.golem.de/0811/63524.html
http://www.planet3dnow.de/vbulletin/showthread.php?p=3779283#post3779283
http://it.anandtech.com/IT/showdoc.aspx?i=3456&p=1
http://www.zdnet.de/enterprise/server/0,39023275,39198656,00.htm

Sorkalm
2008-11-13, 08:24:55
Techreport hat einen Test:
http://www.tecchannel.de/server/prozessoren/1776972/test_amd_opteron_2384_cpu_benchmarks_performance_shanghai/

pipin
2008-11-13, 08:45:49
http://www.golem.de/0811/63524.html

http://www.planet3dnow.de/vbulletin/showthread.php?p=3779283#post3779283

HOT
2008-11-13, 09:49:28
Anand wollte wohl seinen Hauptsponsor nicht verschrecken... ;D
http://it.anandtech.com/IT/showdoc.aspx?i=3456

Undertaker
2008-11-13, 09:55:45
Hmm, wie es ausschaut wurden die erlaubten Tests für die mit Samples versehenen Seiten gehörig eingeschrenkt... Ob man da verhindern wollte, dass womöglich nicht so überzeugende Ergebnisse des folgenden Deneb in Desktopapplikationen noch zurückgehalten werden?
Die Serverperformance ist wie erwartet tadellos, aber die Masse interessiert hier wohl was Spiele aus dem 6MB L3 und den internen Tweaks ziehen können... ;)

reunion
2008-11-13, 09:58:43
Hmm, wie es ausschaut wurden die erlaubten Tests für die mit Samples versehenen Seiten gehörig eingeschrenkt.

Das schließt du woraus? Praktisch jede Seite testet völlig andere Anwendungen, ich kann hier bei bestem Willen keine Einschränkung erkennen. Auch gibt es keinerlei Kommentare dazu. Und das man mit einem Supermicro 2P Server keine Spiele testet sollte nachvollziehbar sein.

Was man auf jeden Fall schon mal sagen kann, ist, dass der neue 45nm Fertigungsprozess erheblich besser läuft als der nie wirklich in fahrt gekommene 65nm Prozess. Der Stromverbrauch des Shanghai ist trotz deutlich höheren Taktraten erheblich geringer als bei Barcelona, das lässt sich natürlich auch auf den Desktopmarkt übertragen. Bei allen anderen muss man abwarten. Man kann aber denke ich durchaus mit mindestens 25-30% mehr Leistung eines Deneb mit 3Ghz im Vergleich zu einem Phenom 9950 rechnen.

AffenJack
2008-11-13, 10:01:00
Wie kommst du darauf, dass die erlaubten tests eingeschränkt wurden? Anand und Tecchanel ham völlig verschiedene tests gemacht, aber ja beide natürlich auf serverprozessoren ausgelegt. Wieso sollten die auch desktopprogramme testen? Die sind im moment schlicht irrelevant. Sobald die ganzen Serversachen getestet wurden, kommt von anand zb vll auchn test mit desktopapplikationen, aber immo wäres einfach schwachsinn sowas zu testen und man würde damit eher die leser vergrauen, die man als ziel hat.

Undertaker
2008-11-13, 10:06:05
Gerade bei Seiten wie Anandtech kann ich mir kaum vorstellen, dass sie diese Gelegenheit auslassen würden, ein wenig in Richtung der Performance des kommenden Deneb zu spekulieren...
Generell finde ich den Benchmarkparkour bei den Tests sehr gering - warum nicht mehr theoretische Vergleichstests zu Barcelona?

AnarchX
2008-11-13, 10:11:59
Interessant ist jedenfalls, dass man die NB und somit auch den L3-Cache beim 2.6 und 2.7GHz Opteron schon mit 2.2GHz taktet, bei Deneb ist da vielleicht sogar noch mehr möglich.

Pirx
2008-11-13, 11:55:14
Hmm, wie es ausschaut wurden die erlaubten Tests für die mit Samples versehenen Seiten gehörig eingeschrenkt... Ob man da verhindern wollte, dass womöglich nicht so überzeugende Ergebnisse des folgenden Deneb in Desktopapplikationen noch zurückgehalten werden?
Die Serverperformance ist wie erwartet tadellos, aber die Masse interessiert hier wohl was Spiele aus dem 6MB L3 und den internen Tweaks ziehen können... ;)
Hier gehts aber um den Shanghai und da werden Tests gemacht, die dessen Marktposition und potentiellen Käufern entsprechen. Spiele haben da eigentlich gar nichts zu suchen.

Gast
2008-11-13, 12:42:23
Hmm, wie es ausschaut wurden die erlaubten Tests für die mit Samples versehenen Seiten gehörig eingeschrenkt... Ob man da verhindern wollte, dass womöglich nicht so überzeugende Ergebnisse des folgenden Deneb in Desktopapplikationen noch zurückgehalten werden?
Die Serverperformance ist wie erwartet tadellos, aber die Masse interessiert hier wohl was Spiele aus dem 6MB L3 und den internen Tweaks ziehen können... ;)


ja du hast vollkommen recht
vom nehalem gibts auch kaum serverbenches, weil intel wohl die schlechten ergebnisse da verheimlichen will

dildo4u
2008-11-13, 13:55:51
ja du hast vollkommen recht
vom nehalem gibts auch kaum serverbenches, weil intel wohl die schlechten ergebnisse da verheimlichen will
Das wirds sein. :rolleyes: Oder ebend weil es noch kein Server Nehalem Launch gab.

"Im SPEC CPU2006 und mit hoch optimiertem Code dank Intels neuester C/C++- und Fortran-Compiler in Version 11 Beta, die bereits SSE4.2-Befehle nutzen, erreicht ein Core i7-965 Extreme Edition beim Ganzzahl-Durchsatz 110 Punkte (int_rate_base_2006) und bei Gleitkommaoperationen 85,1 Punkte (fp_rate_base_2006, gemessen jeweils unter Windows Vista 32-Bit). Damit überholt der erste Nehalem-Vertreter nicht nur alle bisherigen x86- beziehungsweise x64-Prozessoren, sondern sogar die meisten Tandems aus zwei Quad-Core-Opterons (2360 SE: 92,7/84,7 Punkte) und kommt beim Gleitkomma-Durchsatz an zwei 3,2-GHz-Xeons heran."

http://www.heise.de/newsticker/Intel-Core-i7-965-Extreme-Edition-rennt-an-die-x86-Leistungsspitze--/meldung/118293

reunion
2008-11-13, 14:16:14
Neuer Intel-Compiler, SSE4.2-Optimierungen - Vergleichbarkeit ist gleich null. Wobei natürlich niemand bestreitet das Nehalem gerade im Serverbereich eine sehr gute Figur machen wird. Es ging nur um die These das AMD etwas anderes als Serverbenchs unterschlägt und das ist Blödsinn bei einem Launch eines Serverprozessors.

V2.0
2008-11-13, 14:21:47
Wobei Nehalem wohl von Shanghai geschlagen wird. Das macht doch Hoffnung für Deneb gegen Lynnfield.

dildo4u
2008-11-13, 14:26:06
Wobei Nehalem wohl von Shanghai geschlagen wird.
Wie kommst du auf die Idee Shanghai kann grad mal die alten 45nm Intels knapp schlagen was Performance per Watt angeht.Und Nehalem setzt grad da an wo es bei Intel im Serverbereich noch gehapert hat z.B Speicherkontroller und eine schnelle Verbindung zwischen den CPUs.

Spasstiger
2008-11-13, 14:26:10
Gegenüber dem Core 2 scheint die Floating-Point-Performance ja deutlich besser zu sein, siehe SPECfp_rate_base2006.
Aber gegen den Nehalem ist immer noch kein Kraut gewachsen.

AnarchX
2008-11-13, 14:26:51
Wobei Nehalem wohl von Shanghai geschlagen wird. Das macht doch Hoffnung für Deneb gegen Lynnfield.
Wo willst du das sehen? Wenn in SPEC ein Nehalem zwei Quad-Xeons schlägt, dann wird wohl kaum Shanghai diesen schlagen können, der sich nur knapp gegen einen aktuellen Quad-Xeon durchsetzt, selbst wenn hier ein paar Compiler-Optimierungen im Spiel sind.

dildo4u
2008-11-13, 14:39:15
Vorallem gibt es zum 45nm AMD Start wieder keine 3Ghz CPUs möglich das zum Nehalem Server Start im Dezember/Jan nur das 2,7Ghz Modell zum Vergleich herhalten muss.Dann wirds düster wenn Intel mit bis zu 3.2 Ghz und neuer Architektur antritt.

"Schnitzer und Verzögerungen wie beim Start der ersten Quad-Core-Opterons kann sich AMD ein zweites Mal aber nicht mehr leisten. So muss das Unternehmen zügig die bereits angekündigten 105-Watt-Opterons mit höheren Taktfrequenzen produzieren. Denn Intel wird zum Jahreswechsel die nächste Xeon-Generation mit Nehalem-Architektur vorstellen – mit integrierten Speicher-Controllern und seriellem Interface. (cvi)"

http://www.tecchannel.de/server/prozessoren/1776972/test_amd_opteron_2384_cpu_benchmarks_performance_shanghai/index20.html

Psychopat
2008-11-13, 14:56:08
Die höher getakteten Shanghais kommen doch noch - als 105 W Version. Der 2.7 GHz Shanghai hat nur 75 W TDP, nicht vergessen!
Von der Leistung her wird Shanghai nichts gegen Nehalem ausrichten können. Aber beim Stromverbrauch sehe ich Chancen, weil gerade da ja der Nehalem nicht so gut da steht. Also bei der Performance per Watt könnte es durchaus spannend werden welcher Prozessor besser ist.

reunion
2008-11-13, 14:56:43
Wie kommst du auf die Idee Shanghai kann grad mal die alten 45nm Intels knapp schlagen was Performance per Watt angeht.


Knapp? Er schlägt sie um Längen, was aber vorallem an den FB-DIMMs liegt.

Undertaker
2008-11-13, 14:59:48
Das hängt wohl wie immer von der Anwendung ab - und stark von der Ausstattung der verglichenen Testsysteme:

http://www.computerbase.de/news/hardware/prozessoren/amd/2008/november/erste_amd_shanghai-benchmarks/

Hier schenkt er sich mit der E5*** Xeon-Reihe ja praktisch nix.

w0mbat
2008-11-13, 15:03:25
Die höher getakteten Shanghais kommen doch noch - als 105 W Version. Der 2.7 GHz Shanghai hat nur 75 W TDP, nicht vergessen!
Von der Leistung her wird Shanghai nichts gegen Nehalem ausrichten können. Aber beim Stromverbrauch sehe ich Chancen, weil gerade da ja der Nehalem nicht so gut da steht. Also bei der Performance per Watt könnte es durchaus spannend werden welcher Prozessor besser ist.

Nein, der hat ein 95W TDP.

Gast
2008-11-13, 15:03:47
Vom Anandtech Test war ich auch enttäuscht zum vergleich:

Nehalem: 2 Artikel zum launch, insgesamt 35 Seiten + 5 Seiten nachbetrachtung.
Shanghai: 1 Artikel, magere 7 Seiten, hoffentlich kommt da noch was - heißt ja auch nur "Database Testing"...

AnarchX
2008-11-13, 15:04:16
Genau, ACP und TDP sollte man nicht verwechseln, wenn auch AMD es einem nicht leicht macht.

Gast
2008-11-13, 15:04:47
Knapp? Er schlägt sie um Längen, was aber vorallem an den FB-DIMMs liegt.

Also schlägt er sie doch nur knapp, wenn man den richtigen RAM verwendet.

reunion
2008-11-13, 15:07:16
Also schlägt er sie doch nur knapp, wenn man den richtigen RAM verwendet.

Im Serverbereich habe ich bei Intel keine Wahl, wie es am Desktop aussieht muss sich zeigen.

reunion
2008-11-13, 15:08:51
Das hängt wohl wie immer von der Anwendung ab - und stark von der Ausstattung der verglichenen Testsysteme:

http://www.computerbase.de/news/hardware/prozessoren/amd/2008/november/erste_amd_shanghai-benchmarks/

Hier schenkt er sich mit der E5*** Xeon-Reihe ja praktisch nix.

TecChannel hat zwei faktisch gleich ausgestattet Server verwendet, das Ergebnis ist eindeutig: http://www.tecchannel.de/server/prozessoren/1776972/test_amd_opteron_2384_cpu_benchmarks_performance_shanghai/index10.html
Wobei die Intel bei SPECpower eh noch gut wegkommen, wenn man sich die absoluten Werte ansieht: http://www.tecchannel.de/server/prozessoren/1776972/test_amd_opteron_2384_cpu_benchmarks_performance_shanghai/index12.html

Auch der idle-Verbrauch der Xeons liegt deutlich höher: http://www.tecchannel.de/server/prozessoren/1776972/test_amd_opteron_2384_cpu_benchmarks_performance_shanghai/index13.html
http://it.anandtech.com/IT/showdoc.aspx?i=3456&p=4

dildo4u
2008-11-13, 15:10:18
Knapp? Er schlägt sie um Längen, was aber vorallem an den FB-DIMMs liegt.
25% Sind bei mir keine "Längen" aber naja egal das definiert ja Jeder unterschiedlich.
http://www.tecchannel.de/_misc/img/detail1000.cfm?pk=374474&fk=1776972&id=il-80052357004463279

Der HeinZ
2008-11-13, 15:43:40
Sieht mir doch alles sehr nach Gleichstand im Serverbereich aus wenn nicht sogar pro AMD.
Grund hierfür sehe ich einfach das man für einen Nehalem basierten Server komplett die ganze Peripherie ändern muss, sprich neue boards + Prozessor. Zwar hat der mehr Leistung aber der Shanghai hat den entscheidenen Vorteil. Plattformen sind schon vorhanden und ich seh das jetzt mal als Unternehmer so:
-Kein großer Aufwand beim Austausch
-Sofort mehr Leistung und (das interessiert mehr)
- viel weniger Energieverbrauch.

Wahrscheinlich werden sogar Unternehmen die noch auf den alten K8 gesetzt haben da ihnen der Stromverbrauch des Barcelona zu hoch war auf den Shanghai setzen, da dieser ja wesentlich Energieeffizienter ist als sein beiden Vorgänger. Damit schlägt man doch zwei fliegen mit einer Klappe.´
Desweiteren haben wir ja Benchmark technisch noch nicht viel gesehen. Die paar Benches halte ich nicht der Rede wert. Es wird mit sicherheit ältere nicht Multithread-Anwendungen geben, wo vorallem der 3x Level 3 Cache wunder bewirken kann. Nicht jedes Unternehmen setzt auf die aktuellsten super duper Anwendungen.

Und ja manche werden sagen, das man Cache nicht überbewerten soll, aber ich behaupte einfach, das man Cache auch nicht unterbewerten soll und gerade Barcelona einfach zu wenig davon hatte.


Noch was ist irgendjemanden mal aufgefallen das da eine gewisse parallele zu den GPU´s besteht?
HD2000*-Reihe = Schrott
HD3000*-Reihe = Mittel mäßig bis gut, aber PreisLeistung durchweg gut.
HD4000*-Reihe = boar ey, damit hat man nicht gerechnet

Also man kann an AMD vieles bemängeln, aber man kann nicht sagen, dass Sie aus Fehlern nix lernen. Das sind zwei Beispiele die mir persönlich reichen. Wobei Intel da nicht anders ist, siehe Pentium 4 auf Pentium M auf CoreDuo und den aktuellen Core2.

Schön das wir mal wieder in eine Phase kommen in denen man sich eine Schlacht liefern kann, sowohl im Prozzi als auch im GPU Markt. MIch freut das, denn ich lese gerne. :-)
Gruß Matthias

Coda
2008-11-13, 16:03:58
Server-CPUs werden eher selten ausgetauscht. Man kauft normalerweise ganze neue Systeme.

Der HeinZ
2008-11-13, 16:20:13
Server-CPUs werden eher selten ausgetauscht. Man kauft normalerweise ganze neue Systeme.

Echt? Hmm... Dann hat mein Argument nich so den Wert.... wobei ich es doch wirtschaftlicher fände. Vorallem in diesem Beispiel!

Coda
2008-11-13, 16:28:26
Die Leute die die CPUs austauschen muss man auch bezahlen und ein Produktivsystem kann man auch nicht einfach mal so ausschalten für nen Tag. Deshalb wird eher migriert, d.h. komplett neues System, das alte Zeug drauf (evtl. als VM), dann schauen ob alles läuft und schließlich umschalten.

Wo man es eher macht ist bei Rechenclustern.

Der HeinZ
2008-11-13, 16:33:04
Die Leute die die CPUs austauschen muss man auch bezahlen und ein Produktivsystem kann man auch nicht einfach mal so ausschalten für nen Tag. Deshalb wird eher migriert, d.h. komplett neues System, das alte Zeug drauf (evtl. als VM), dann schauen ob alles läuft und schließlich umschalten.

Wo man es eher macht ist bei Rechenclustern.

Ah ok.

Argoth
2008-11-13, 16:47:14
Die Leute die die CPUs austauschen muss man auch bezahlen und ein Produktivsystem kann man auch nicht einfach mal so ausschalten für nen Tag. Deshalb wird eher migriert, d.h. komplett neues System, das alte Zeug drauf (evtl. als VM), dann schauen ob alles läuft und schließlich umschalten.

Wo man es eher macht ist bei Rechenclustern.

Aber wenn man sowieso schon mit VM's arbeitet, kann das auch Online gehandhabt werden.

Beispiel:
ESX Umgebung mit 3 physikalischen Servern und darauf 6 virtuellen. Die Physikalischen Maschinen sind ca 50% ausgelastet.

-->umrüstung der CPU's damit noch mehr VM's auf den Physikalischen Servern laufen können.

Was kann man dann machen?

1 physikalischer Server wird aus der Umgebung genommen und die 2 sich darauf befindenden virtuellen Server werden auf die anderen 2 physikalisch verfügbaren verteilt. Anschliessend kann der dritte physikalische heruntergefahren und umgerüstet werden. Die Services welche auf den virtuellen Maschinen laufen werden nicht beeinträchtigt und innerhalb eines Tages (denke ich) sollten alle 3 physikalischen Server umgerüstet sein.


Ich wage es zu behaupten, dass diese Art der Migration einiges günstiger ist, als wenn 3 komplett neue Server angeschafft werden für die gleiche Umgebung.

Coda
2008-11-13, 16:55:17
Wenn man mit VMs arbeitet - ja. Fragt sich wie viele das momentan schon machen.

AffenJack
2008-11-13, 17:12:44
hmm, so langsam glaube ich, dass amd ihre samples verdammt spät rausgegeben hat. Würde erklären wieso es bisher erst 1 richtiges Review(Tecchanel) und nen weiteren kleineren test(anandtech) gibt.Aber anandtech hat normalerweise ausführlicher getestet. Es werden wohl erst in den nächsten tagen mehr tests kommen. Es müssen schließlich mehr samples verteilt worden sein, als einzig zu anandtech,techchannel und c`t.

Argoth
2008-11-13, 17:27:11
Wenn man mit VMs arbeitet - ja. Fragt sich wie viele das momentan schon machen.

Grossbetriebe sind ziemlich viele massiv am Virtualisieren (so wie unser ;) )

27 ESX Hosts mit c.a. 130 virtuellen Servern.. und das ist erst der Anfang :)

Mir sind auch schon Kleinbetriebe bekannt, welche am Virtualisieren sind.

Wer noch nicht geschnallt hat, dass Virtualisierung die Zukunft ist, ist einfach nur blind.

AffenJack
2008-11-13, 17:54:54
Da wir schon bei virtualisierung sind, hier dazu noch paar benches, zumindest da sieht der shanghai verdammt gut aus, wobei ich auch ka hab wie der barcelona da genau war.
shangai @2,7ghz 2p 8core score : 11,22
http://www.vmware.com/files/pdf/vmmark/VMmark-Dell-2008-11-12-R805.pdf

harpertown @ 3,33ghz 2p 8core score : 9,15
http://www.vmware.com/files/pdf/vmmark/VMmark-HP-2008-10-09-ML370.pdf


shangai @2,7ghz 4p 16core score : 20,35
http://www.vmware.com/files/pdf/vmmark/VMmark-Dell-2008-11-12-R905.pdf

tigertown @2,93 4p 16cores score: 14,14
http://www.vmware.com/files/pdf/vmmark/vmmark_hp5.pdf

Dunnington @2,66 4p 24cores score 19,10
http://www.vmware.com/files/pdf/vmmark/vmmark_ibm4.pdf

quelle:http://www.xtremesystems.org/forums/showthread.php?t=207607

edit:
Barcelona 2,5ghz 2p 8,07
Barcelona 2,5ghz 4p 15.35

also in dem bereich ordentliche steigerungen wies aussieht.

Gast
2008-11-13, 17:59:30
Oft liegt der Engpass ja nicht an der CPU allein, dann bringt es auch nichts wenn du diese einfach ersetzen kannst. Außerdem dein Beispiel hinkt etwas, oder willst du ernsthaft 3 von 3 Produktivservern an einem Tag mit teilw. neuer und ungetesteter HW vollstopfen? No risk no fun, was? Was wenn dein neues Bios in ner Woche spirenzchen macht, oder der Praktikant beim CPU Einbau geschludert hat und diese sich am nächsten Tag um 8.20 mit 100% load verabschiedet? Es hat schon seine Gründe das Server am Stück ersetzt werden: ntars :).

user77
2008-11-13, 18:07:26
ja wir habe hier auch ein bladesystem auf dem wir die Server hin und her verschieben können. zusammen mit ner SAN ne tolle Sache.

roidal
2008-11-14, 09:15:34
Was man davon halten soll:
AMD wollte weder uns noch vielen anderen Endkunden-orientierten Medien ein Testsystem zur Verfügung stellen. Vermutlich deshalb, weil ein Shanghai mit den aktuellen Taktfrequenzen bei Spielen wenig gegen einen Nehalem-basierten Prozessor ausrichten könnte.

AnarchX
2008-11-14, 09:20:06
Naja, Deneb soll ja auch mit 2.8GHz und 3GHz launchen, dazu wird die NB wohlmöglich mit 2.4GHz takten und DDR2-1066-Support an Board sein, durchaus ein paar Unterschiede, die das Bild im Verhältnis zum i920 wohl etwas verändern können.

Schlammsau
2008-11-14, 09:35:01
Hier nochmal zusammengefasst: Opteron wieder Nummer Eins bei Virtualisierung (http://www.computerbase.de/news/hardware/prozessoren/amd/2008/november/opteron_nummer_eins_virtualisierung/)

Gast
2008-11-14, 09:43:56
Wenn man mit VMs arbeitet - ja. Fragt sich wie viele das momentan schon machen.
einige. soweit ich das von der VMWare und Hyper V fraktion lese/höre. leider hab ich die blöden xeons gekauft damals, dachte nicht dass der shanghai soviel aufholt.

Gast
2008-11-14, 10:06:03
Noch ein review:

http://www.zdnet.de/enterprise/server/0,39023275,39198656,00.htm

AnarchX
2008-11-14, 10:09:58
Noch ein review:

http://www.zdnet.de/enterprise/server/0,39023275,39198656,00.htm

Interessant, etwas Consumer bzw. Pro-User-lastiger.

http://img266.imageshack.us/img266/2496/7zip3757076ly7.png (http://imageshack.us)

Hier brauch es schon fast zwei Quads gegen Nehalem:
http://www.au-ja.de/review-intel-corei7-extreme-965-16.phtml

AffenJack
2008-11-14, 10:11:21
Zitat von PC Games Hardware
AMD wollte weder uns noch vielen anderen Endkunden-orientierten Medien ein Testsystem zur Verfügung stellen. Vermutlich deshalb, weil ein Shanghai mit den aktuellen Taktfrequenzen bei Spielen wenig gegen einen Nehalem-basierten Prozessor ausrichten könnte.

lol, da macht sich die pcgh aber echt lächerlich, amd hat sicher besseres zu tun als jedem x-beliebigen spielemagazin nen server als testsample zu geben. Es passen auf die Testsysteme die amd verteitl hat doch zumindest zum teil nichtma pci-e grafikkarten, will man das 2p system dann als software renderer testen?

reunion
2008-11-14, 10:16:45
Interessant, etwas Consumer bzw. Pro-User-lastiger.

http://img266.imageshack.us/img266/2496/7zip3757076ly7.png (http://imageshack.us)

Hier brauch es schon fast zwei Quads gegen Nehalem:
http://www.au-ja.de/review-intel-corei7-extreme-965-16.phtml

Bei solchen Anwendungen macht sich HT eben bezahlt. Man sieht ja das Nehalem ohne HT auch kaum besser liegt als ein Core2. Wobei mit 3Ghz Taktfrequenz, DDR-1066 und keiner vor allem auf Stabilität optimierten Serverplattform schon noch was möglich sein sollte.

Gast
2008-11-14, 10:39:26
lol, da macht sich die pcgh aber echt lächerlich, amd hat sicher besseres zu tun als jedem x-beliebigen spielemagazin nen server als testsample zu geben. Es passen auf die Testsysteme die amd verteitl hat doch zumindest zum teil nichtma pci-e grafikkarten, will man das 2p system dann als software renderer testen?
die sind eh je länger je mehr opportunisten. schade eigentlich, aber war absehbar. intelligenz ist dünn verteilt heutzutage.

Gast
2008-11-14, 12:27:58
Vielleicht ganz nützlich...sämtlich Dokumente im Original:
http://www.amd.com/us-en/Corporate/InvestorRelations/0,,51_306_15891,00.html

fdk
2008-11-14, 13:02:23
Die pdfs sind teilweise echt grausam - zB. die letzte ~ ab Seite 12. Teilweise böse unscharf, seltsam skaliert oder Teile überschneiden sich. Eigentlich nicht würdig für ein Unternehmen der Größe.

darkvader
2008-11-14, 13:30:57
War bestimmt ein kostensparender pdf creator und kein teures original von Adobe :-)

Stray_bullet
2008-11-14, 15:00:34
War bestimmt ein kostensparender pdf creator und kein teures original von Adobe :-)
;D Erstellt mit Adobe Acrobat Distiller 6.0 :wink:

Psychopat
2008-11-14, 15:00:51
Naja, Deneb soll ja auch mit 2.8GHz und 3GHz launchen, dazu wird die NB wohlmöglich mit 2.4GHz takten und DDR2-1066-Support an Board sein, durchaus ein paar Unterschiede, die das Bild im Verhältnis zum i920 wohl etwas verändern können.

Deneb hat ausserdem 8 statt 6 mb lvl3 Cache
Hab nur die 8mb auf den Slides gesehen. Aber stimmt, der lvl2 wird da mitgezählt.

Edit: aus Sparsamkeit hat wohl ein Praktikant die pdf's erstellt :D

SavageX
2008-11-14, 15:08:47
Deneb hat ausserdem 8 statt 6 mb lvl3 Cache


Nein, die 8 MB wären 6MB L3 + (4x512K) L2.

Der HeinZ
2008-11-14, 15:39:39
Nein, die 8 MB wären 6MB L3 + (4x512K) L2.
Agreed

Der HeinZ
2008-11-14, 23:14:29
Oft liegt der Engpass ja nicht an der CPU allein, dann bringt es auch nichts wenn du diese einfach ersetzen kannst. Außerdem dein Beispiel hinkt etwas, oder willst du ernsthaft 3 von 3 Produktivservern an einem Tag mit teilw. neuer und ungetesteter HW vollstopfen? No risk no fun, was? Was wenn dein neues Bios in ner Woche spirenzchen macht, oder der Praktikant beim CPU Einbau geschludert hat und diese sich am nächsten Tag um 8.20 mit 100% load verabschiedet? Es hat schon seine Gründe das Server am Stück ersetzt werden: ntars :).

Okay dann lass ich das nicht den Praktikanten machen sondern mache es selbst. :D
Klar sind neue CPU´s kein allheilmittel, aber für meine Stromrechnung eben doch, da die Prozessoren weniger verbrauchen, und wenn nicht die volle Last benötigt wird, schalten sie runter und verbrauchen noch weniger, und sind immernoch so produktiv oder produktiver als mein Altsystem bei voller Leistung. Naja ich bin aber nur totaler leihe in diesem Bereich und hab grad einfach mal das Thema "steigende Energiekosten" und "Anschaffungspreis" als Schwerpunkt genommen.

Aber man lernt eben nie aus.

Gast
2008-11-15, 01:03:15
Edit: aus Sparsamkeit hat wohl ein Praktikant die pdf's erstellt :DKlingt wahrscheinlich, Propus haben sie ja auch falsch geschrieben.

Spasstiger
2008-11-15, 01:33:19
Hier nochmal zusammengefasst: Opteron wieder Nummer Eins bei Virtualisierung (http://www.computerbase.de/news/hardware/prozessoren/amd/2008/november/opteron_nummer_eins_virtualisierung/)
Taktbereinigt sind da die 16 Opteron-Cores immerhin um 56% schneller als die 16 Xeon-Core.
Selbst gegenüber 24 Xeon-Cores liegen die 16 Opteron-Cores noch um 7% vorne.

Gut, wenn der Nehalem richtig loslegen kann, erreicht er die Performance von 8 aktuellen Xeon-Cores und dann wäre der Opteron auch wieder hinten dran. Wann sollen denn multiprozessorfähige Nehalem-Xeons und entsprechende Boards kommen?

=Floi=
2008-11-15, 03:41:53
1. spielen die stromkosten des servers so gut wie keine rolle
da schlagen lohnkosten oder die x-fach höhere stückzahl der clients viel stärker zu buche.
2. wenn ein server nur in den sparmodus schaltet, dann ist er überflüssig ;D


das beispiel mit den 3 virtuellen maschinen finde ich auch ganz lustig. bevor man da stunden rumfrickelt und die anderen virtuellen maschinen auf die anderen pcs migriert, kann man gleich die kisten zerlegen und den prozessor tauschen. (soetwas kann man auch am WE machen, oder im betriebsurlaub)

Gast
2008-11-15, 10:57:07
@=Floi=:
Kommt drauf an, wieviel Server Du hast .. frag mal google :)

SavageX
2008-11-15, 11:02:24
1. spielen die stromkosten des servers so gut wie keine rolle
da schlagen lohnkosten oder die x-fach höhere stückzahl der clients viel stärker zu buche.


Richtig, nur gilt auch ungefähr "für jedes Watt Verbrauch kommt noch ein Watt für die Entsorgung hinzu" - Klimaanlagen halt. Einige Serverräume sind auch "thermisch limitiert", d.h. um weiter wachsen zu können müsste erstmal die Klimaanlage erweitert werden (teuer). Wenn man altes Eisen auf sparsame Maschinen konsolidiert, so kann man sich dies gelegentlich sparen und hat auch wieder Luft nach oben.

Grumbart
2008-11-15, 11:05:34
1. spielen die stromkosten des servers so gut wie keine rolle
da schlagen lohnkosten oder die x-fach höhere stückzahl der clients viel stärker zu buche.
2. wenn ein server nur in den sparmodus schaltet, dann ist er überflüssig

Aus eigener Firmenerfahrung
zu 1.) die Stromkosten selbst, sind zwar zweitrangig, Wärmeentwicklung und Stellfläche jedoch nicht. Das war einer der Gründe warum wir wenig Barcelonas im Betrieb haben. Gerade in der Disziplin Energieeffizienz schlägt sich der Shanghai wohl sehr gut. /edit - sowie das SavageX dargestellt hat
zu 2.) wir haben ca. 150 Server im Einsatz, von denen läuft mit Sicherheit weniger als ein Drittel am "Anschlag". Das hängt einfach vom Einsatzgebiet der jeweiligen Server ab.

fdk
2008-11-15, 15:02:25
@Spasstiger:
Nehalem-Xeons sind für q1/2009 geplant(stand gestern in bei den Preisinfos), kommen zB. hier zum Einsatz:
http://www.heise.de/newsticker/HLRN-II-Superrechner-wird-mit-Intels-Nehalem-Xeons-bestueckt--/meldung/110812

Sorkalm
2008-11-15, 16:54:00
Nehalem-Xeons sind für q1/2009 geplant(stand gestern in bei den Preisinfos)

Das sind aber nur die für 2P-Systeme. Der Dunnington-Nachfolger Beckton (8 Kerne und für bis zu 8P-Systeme) ist für H2 2009 anvisiert und dürfte dann wahrscheinlich gegen Istanbul antreten.

reunion
2008-11-16, 15:06:18
AMD veröffentlicht Errata-Liste des Shanghai:
http://www.planet3dnow.de/cgi-bin/newspub/viewnews.cgi?id=1226832935

HOT
2008-11-17, 14:18:36
Randnotiz :D:
http://www.planet3dnow.de/cgi-bin/newspub/viewnews.cgi?id=1226919938
Viele davon sind Barcelonas.

AnarchX
2008-11-18, 09:41:19
http://img408.imageshack.us/img408/2623/nehalem9659007630432jw3.png (http://imageshack.us)
http://www.amdzone.com/phpbb3/viewtopic.php?f=52&t=135802

Der HeinZ
2008-11-18, 10:34:18
http://img408.imageshack.us/img408/2623/nehalem9659007630432jw3.png (http://imageshack.us)
http://www.amdzone.com/phpbb3/viewtopic.php?f=52&t=135802

Das sind "Barcelona" Opterons oder ? Da hab ich aber ein schlechteres Ergebniss für AMD erwartet, selbst wenn AMD hier die doppelte Anzahl an Kernen hat. Da wird "Shanghai" ja doch nochmal ein bißchen was reißen können. Nur die die INTeger Werte machen mir sorgen. Da kloppt der neue Intel ja alles weg.

AnarchX
2008-11-18, 10:42:42
Das sind "Barcelona" Opterons oder ?
Opteron 2384 ist der 2.7GHz Shanghai.

Pirx
2008-11-18, 11:02:17
Hat der i7 da so viel brach liegende Leistung, dass ihm HTT noch hilft, oder reicht einfach die Leistung eines Kerns über HTT "aufgeteilt" um in die Nähe von 2 AMD-Kernen zu kommen/zu überholen:| oder verfälscht das HTT??:confused:

Gast
2008-11-18, 11:13:28
Nur die die INTeger Werte machen mir sorgen. Da kloppt der neue Intel ja alles weg.
Der Hauptvorteil ist bei 462.libquantum:

http://www.spec.org/auto/cpu2006/Docs/462.libquantum.html

Fragt sich, wieso ...

Der restlich Vorteil wird u.a. wohl auch aufs SSE4.2 Konto gehen.

fdk
2008-11-18, 11:16:21
Gute Frage, ein Vergleich mit HT off beim i965 wäre interessant.

Gast
2008-11-18, 11:27:23
Gute Frage, ein Vergleich mit HT off beim i965 wäre interessant.
HT bringt eigentlich bei Spec immer was, die Zeit die so ne CPU sonst auf Speicheranforderungen wartet ist schon immens, das können schon mal 50-100 Takte sein, in denen nichts gemacht wird. In der Zeit kann HT die Piplines mit dem 2. Thread auslasten.

Gast
2008-11-19, 07:42:38
Gute Frage, ein Vergleich mit HT off beim i965 wäre interessant.Warum bei SMT off vergleichen?! HT ist für den i965 ein ganz normales Feature eines i7-Cores und muß aktiviert sein für sinnvolle Vergleiche. Wenn es so viel zusätzliche Leistung bringt, dann ist es eben so. Denn es wird wohl kein i7-Server Käufer SMT in seinen Servern abschalten wollen. Das Rest des i7-Kerns nicht wesentlich optimiert worden ist, das ist doch schon hinlänglich bekannt und außerdem ein vollkommen sinnfreier Vergleich.

BlackBirdSR
2008-11-19, 11:19:19
Hat der i7 da so viel brach liegende Leistung, dass ihm HTT noch hilft, oder reicht einfach die Leistung eines Kerns über HTT "aufgeteilt" um in die Nähe von 2 AMD-Kernen zu kommen/zu überholen:| oder verfälscht das HTT??:confused:

SMT ist eines der beeindruckensten Features, die man in eine CPU einbauen kann. Mit vergleichsweise minimalem Aufwand kann man so sehr hohe Gewinne erzielen.
Die meisten CPUs kommen nicht an ihre Peak-Leistung heran. Gerade x86 ist da keine Ausnahme. SMT hilft auf der einen Seite die Einheiten etwas besser zu versorgen, verringert auf der anderen Seite die Leerlaufzeiten durch Stalls ganz erheblich. Wie man sieht, ist es dabei gar nicht so wichtig ob nun breit und kurz (Nehalem), schmall und lang (Prescott) oder InOrder (Atom).
Das Leistung für Single-Thread-Anwendungen verloren gehen kann liegt leider am Scheduling. Halb so wild.

@Spec: Ich glaube nicht, dass SSE4.2 so viel ausmacht. Eher noch die sinkende Latenz und steigende Bandbreite. Einige einzelne Tests profitieren immer mehr als andere. Und natürlich darf man nie vergessen, dass es noch die ein oder anderen Compiler-Tricks gibt, die man natürlich gerne für soetwas zurückhält.

HOT
2008-11-19, 12:03:05
Bedenkt man den Taktunterschied und dass ein 2-CPU-System nie zu 100% skaliert, siehts bei SPECfp garnicht schlecht aus für den K10.5, trotz SMT. Aber bei Int ist der Nehalem durch SMT nicht zu schlagen für den K10.5. Das liegt an der doch recht unterschiedlichen Architektur. Bin mal gespannt auf Äpfel mit Äpfel-Vergleiche mit 2-CPU-Gainstown vs. 2-CPU-Shanghai bei ähnlichen Taktraten.

reunion
2008-11-19, 12:21:04
Und vor allem ohne SSE4.2, das für enorme Zuwächse sorgen kann, aber in der Praxis heute nirgends eingesetzt wird.

Gast
2008-11-19, 12:28:14
Und vor allem ohne SSE4.2, das für enorme Zuwächse sorgen kann, aber in der Praxis heute nirgends eingesetzt wird.
Naja .. wer nach Spec Werten Systeme kauft, kompiliert größtenteils auch selbst...

Gast
2008-11-19, 12:29:37
P.S: Ausserdem läuft bei AMDs Spe Werten auch SSE4a. Wie praxisrelevant das wohl ist.

HOT
2008-11-19, 14:45:16
Und AMB.
Das ist schon relevant, da der VS2008 Compiler beides offiziell unterstützt, sowohl SSE4a, als auch AMB. AMDs SSE ist nicht relevanter/irrelevanter als Intels SSE, bis auf die 2 bekannten Codecausnahmen.

S940
2008-11-19, 16:34:40
Huch, was ist AMB ?
Ein Befehlssatz, hab ich ja noch nie zuvor gehört ... bitte um Link, google liefert bei "AMB" recht viel ..

Edit:
Ah ... jetzt:
Advanced Bit Manipulation, das sind die popcnt etc. Befehle, die Intel auch mit SSE4.2 nachliefert.
Aber das gehört doch offiziell zu SSE4a, oder nicht ?

Naja egal, weiss jetzt was gemeint war ^^

Thx

Alex

Der HeinZ
2008-11-19, 16:55:20
Opteron 2384 ist der 2.7GHz Shanghai.

Das ist doch zuim heulen...
Übernimmt AMD später eigentlich wieder die Intel Erweiterungen?

AnarchX
2008-11-19, 16:57:32
Übernimmt AMD später eigentlich wieder die Intel Erweiterungen?
SSE4.2?
Oder meinst du SMT, was, siehe BlackbirdSR, wenn AMD clever ist, aber Bulldozer auf jeden Fall in AMD-CPUs Einzug halten sollte, denn billiger gibt es Leistung kaum, gerade wenn man im Servermarkt mitmischt.

Avalox
2008-11-19, 19:13:12
AMD sind ja auch quasi die letzten ohne SMT. IBM, SUN und Intel bieten dieses ja schon länger.

Was ist eigentlich mit VMT? Wann wird dieses denn in @Home CPUs einziehen?

Der HeinZ
2008-11-20, 10:46:49
SSE4.2?
Oder meinst du SMT, was, siehe BlackbirdSR, wenn AMD clever ist, aber Bulldozer auf jeden Fall in AMD-CPUs Einzug halten sollte, denn billiger gibt es Leistung kaum, gerade wenn man im Servermarkt mitmischt.

Ja sowohl als auch. Wie bereits erwähnt ist AMD ja der letzte in dem Bereich SMT. Und SSE4.2 wird wahrscheinlich wieder ne "größere" Unterstützung finden als SSE4a. Und diese kleinen Erweiterungen können schon mal Geschwindigkeitsrelevant sein, hierzu möchte ich mal an DIVX errinnern. Für den Servermarkt eher uninteressant, für den Heinmanwender aber schon. Ich brauch einfach mehr Speed bei H.264. sobald ich da die Referenzbilder auf 16 erhöhe, geht da bei mir garnix mehr,selbst wenn ich nen Quad hätte, 3 bilder pro Sek. bei nicht HD-Material geht einfach nicht, und das nervt.<--Offtopic

Coda
2008-11-20, 13:32:59
Was ist eigentlich mit VMT? Wann wird dieses denn in @Home CPUs einziehen?
Was meinst du damit?

Avalox
2008-11-20, 20:01:25
Was meinst du damit?


Na Fujitsu hat im SPARC64 VI+ wohl eine sehr interessante Coarse Grain MT Variante realisiert.
Intel hat wohl ab dem Montecito ähnliche Ansätze zu bieten.
Na jedenfalls konnte Fujitsu mit nur sehr geringen schaltungstechnischen Aufwand den Durchsatz der MultiCore CPU um 20% steigern. (bei entsprechend vielen Threads).

S940
2008-11-20, 21:08:06
Bokill hats im seinen Glossar:

http://www.orthy.de/index.php?option=com_glossary&Itemid=55&func=view&id=329

AnarchX
2008-11-20, 21:43:35
http://img408.imageshack.us/img408/2623/nehalem9659007630432jw3.png (http://imageshack.us)
http://www.amdzone.com/phpbb3/viewtopic.php?f=52&t=135802

Dual-Nehalem-EP @2.8GHz:
Epic scaling

All of that is gone with Nehalem EP, replaced with the sleek new Quick Path Interconnect and on-die memory controllers. The result is truly epic bandwidth and performance scaling. The big number many will be waiting for is the SPECfp base rate. So here it is: 160.

To put that into context, the Intel's current Penryn-based Xeon dual-socket platform fails to hit 90, even running at 3.4GHz. Perhaps even more significantly, AMD's shiny new 45nm Shanghai chips in dual-socket 2.7GHz trim score just 105 points. Even a four-socket Shanghai rig is only good for just under 190.

Just to confirm that our eyes did not deceive us, we also gave Nehalem EP a quick going over with the Stars Euler3D benchmark. It's a computational fluid dynamics simulation that majors on floating point performance.

Sure enough, Nehalem EP roasts all comers in this benchmark, too – it's twice as quick as a pair of 2.7GHz Shanghai processors (14.34 seconds to complete five instances versus 30.32 seconds).

http://www.techradar.com/news/computing-components/processors/world-exclusive-intel-s-dual-socket-nehalem-ep-platform-benchmarked-487131

Und das zu einem Preis von wohl $1.172 (http://www.computerbase.de/news/hardware/prozessoren/intel/2008/november/modellnummern_preise_nehalem-xeons/) pro CPU, wo hingegen AMD bei $989 bzw. $2.149 (http://www.pcgameshardware.de/&menu=browser&image_id=936323&article_id=666774) pro CPU steht.

Gast
2008-11-20, 22:17:36
der Shanghai ist aber bereits verfügbar! sollte man imo auch nicht vergessen. Wenn der Xeon Nahelem mal raus ist, werden die Preise sicherlich angepasst.

reunion
2008-11-20, 22:22:16
Kein Wunder, SpecFP hängt wie kaum ein anderer Bench an der Speicherbandbreite.

Gast
2008-11-21, 00:06:03
Hat jemdan Werte von AMD Opteron Systemen mit Unterschiedlicher Speichbandbreite zur Hand? Wäre in Bezug auf Shanghai @ddr3 recht interessant wie ich finde?!

Gast
2008-11-21, 08:24:35
damit ist auch klar wieso die fiorina plattform (oder so) noch nicht gereleast wird. man wartet den nehalem launch ab, um zu sehen ob HT3 reicht...

pest
2008-11-21, 08:37:25
angeblich soll auf ner AMD-Pressekonferenz der Phenom II auf 5Ghz DI/6Ghz LN2 gebracht worden sein :D, wenn er dann noch ne IPC ähnlich dem Yorkfield hat, wird's spannend.

AnarchX
2008-11-21, 08:56:40
angeblich soll auf ner AMD-Pressekonferenz der Phenom II auf 5Ghz DI/6Ghz LN2 gebracht worden sein :D, wenn er dann noch ne IPC ähnlich dem Yorkfield hat, wird's spannend.
Darüber wird hier diskutiert: http://www.forum-3dcenter.org/vbulletin/showthread.php?p=6925478#post6925478

S940
2008-11-21, 11:13:21
Kein Wunder, SpecFP hängt wie kaum ein anderer Bench an der Speicherbandbreite.
Jupp, aber SMT hilft schon auch ungemein, man muss die Bandbreite auch ausnützen können.

Da das System auch "nur" 24GB hat, lief SpecFP 99,9% nur 32bittig, ein 64bit Thread benötigt 2 GB RAM, d.h. 32GB wären für ein 2P Nehalem Sys nötig.

Soll heißen, 5-10% plus wegen dieser und andrer Optimierungen (es kommen z.B. auch Xeons mit DDR3-1333) sind noch drin.
Aber das Ergebnis ist schon so recht gut, ein einzelner Nehalem hat mit 3,2 GHz ~82 Punkte. Die zwei mit 2,8 GHz jetzt 160. Gute Skalierung.

ciao

Alex

Gast
2008-11-21, 14:02:38
Gibts eigentlich Neuigkeiten zu den passenden Chipsets..?
Flashback:
AMD will introduce the SR5690 and SP5100 northbridge chips. These would be aided by SS7100 southbridge chips. These chipsets offer the features AMD’s enterprise platforms have been begging for, such as full-speed HyperTransport 3.0 system interface at 5200 MT/s, PCI-Express 2.0 with hotplug capabilities, and an I/O Memory Management Unit (IOMMU). This part is said to provide significant boosts to virtualization efficiencies by providing better peer-to-peer communication between sockets and direct communication between CPUs and devices. Additionally, the IOMMU is said to enhance security by preventing unauthorized memory access by devices. The SP5100 however is said to lack the IOMMU.

In other news, these chipsets come out around the same time when AMD introduces its 6-core Opteron processor codenamed Istanbul.
http://blog.colomove.com/opteron-to-get-homegrown-chipsets-in-2009/2008/09/10/

Gast
2008-11-21, 14:39:29
q2/q3 09 kommen die raus.

Gast
2008-11-21, 14:45:14
Da das System auch "nur" 24GB hat, lief SpecFP 99,9% nur 32bittig, ein 64bit Thread benötigt 2 GB RAM, d.h. 32GB wären für ein 2P Nehalem Sys nötig.

falsch, alle threads eines prozesses teilen sich den gleichen adressbereich (was ja gerade der große vorteil von threading ist), wodurch mehrere threads nicht mehr speicher zur verfügung haben als einer.

Gast
2008-11-21, 15:10:41
http://gamestar.de/hardware/tests/prozessor/1951268/phenom_ii_x4.html

ist doch nich schlecht für ne server cpu oder?

BlackBirdSR
2008-11-21, 15:22:10
falsch, alle threads eines prozesses teilen sich den gleichen adressbereich (was ja gerade der große vorteil von threading ist), wodurch mehrere threads nicht mehr speicher zur verfügung haben als einer.

hier gehts ausnahmsweise mal um physikalischen Speicher

BvB123
2008-11-21, 17:24:53
http://gamestar.de/hardware/tests/prozessor/1951268/phenom_ii_x4.html

ist doch nich schlecht für ne server cpu oder?

Die Desktop Variante unterscheided sich aber nicht von diesem.

Gast
2008-11-21, 17:49:20
aber das drumherum ganz erheblich: ddr2 800 ecc, 8x pcie 1.0

Gast
2008-11-21, 18:31:40
aber das drumherum ganz erheblich: ddr2 800 ecc, 8x pcie 1.0Der CoreI7 wird auch nur mit 1066MHz DDR3 angetrieben. Hier geht auch noch mehr!

Gast
2008-11-22, 21:16:36
http://www.amdzone.com/phpbb3/viewtopic.php?f=52&t=135802&st=0&sk=t&sd=a&hilit=fugger&sid=68ef14444434a7eeda25e4a23d008076

den Thread sollte man sich vielleicht noch durchlesen, was die sehr guten Ergebisse des Corei7 bei specft und specint schon deutlich relativiert!
U.a. war der Turbemode bei dem an!

Gast
2008-11-22, 21:19:12
http://www.amdzone.com/phpbb3/viewtopic.php?f=52&t=135802&st=0&sk=t&sd=a&hilit=fugger&sid=68ef14444434a7eeda25e4a23d008076

den Thread sollte man sich vielleicht noch durchlesen, was die sehr guten Ergebisse des Corei7 bei specft und specint schon deutlich relativiert!
U.a. war der Turbemode bei dem an!

Edit: außerdem wurde ein Intel SSD beim i7 verwendet!

Gast
2008-11-22, 22:30:16
http://www.amdzone.com/phpbb3/viewtopic.php?f=52&t=135802&st=0&sk=t&sd=a&hilit=fugger&sid=68ef14444434a7eeda25e4a23d008076

den Thread sollte man sich vielleicht noch durchlesen, was die sehr guten Ergebisse des Corei7 bei specft und specint schon deutlich relativiert!
U.a. war der Turbemode bei dem an!Der Turbo-Mode sollte gar nicht aktiviert worden sein. Alle Kerne waren unter Volllast. Der Turbo-Mode beschleunigt bei Single-Treaded Software mit wenig Workload auf den anderen Kernen. Bei der Spec2006 arbeiten alle Kerne auf Volllast.

Gast
2008-11-22, 22:30:59
Edit: außerdem wurde ein Intel SSD beim i7 verwendet!Die Intel-SSD ist für die Spec-Suite fast irrelevant.

Gast
2008-11-22, 22:37:35
Die Intel-SSD ist für die Spec-Suite fast irrelevant.

Warum ist dann der Unterschied zwischen gleichgetakteten Core2Quad und Nahelem, wenn beide eine SSD verwenden, viel geringer?

Gast
2008-11-22, 22:39:11
Warum ist dann der Unterschied zwischen gleichgetakteten Core2Quad und Nahelem, wenn beide eine SSD verwenden, viel geringer?
nämlich "nur" ca. 50%, statt den 100 bzw. 65%! ohne ssd... ,
oder verstehe ich da was falsch?

Gast
2008-11-22, 22:53:32
Der Turbo-Mode beschleunigt bei Single-Treaded Software mit wenig Workload auf den anderen Kernen.

der turbo-mode ist immer aktiv wenn last anliegt und temperatur und stromverbrauch es zulassen.

Gast
2008-11-23, 08:49:43
nämlich "nur" ca. 50%, statt den 100 bzw. 65%! ohne ssd... ,
oder verstehe ich da was falsch?Die SpecCPU 2006 sollte nicht derart abhängig von der Disk I/O sein. Die Ergebnisse sind verdächtig. So wie der ganze Thread spekulativ ist und viele 'Annahmen' tätigt.

Gast
2008-11-23, 08:50:54
der turbo-mode ist immer aktiv wenn last anliegt und temperatur und stromverbrauch es zulassen.Und das Termal-Throttling ebenso. Eventuell ist der I7 auf Grund von Überhitzung eine Zeit lang deutlich <3GHz gelaufen?

Coda
2008-11-23, 13:37:13
SpecCPU läuft 100% aus dem Speicher. Es ist nicht der Sinn eines CPU-Benchmarks die Disk-Performance zu messen.

Gast
2008-11-23, 15:17:40
SpecCPU läuft 100% aus dem Speicher. Es ist nicht der Sinn eines CPU-Benchmarks die Disk-Performance zu messen.


Was Sinn und Unsinn ist steht überhaupt nicht zur Debatte.

Deine Aussage ist zu überprüfen. Sobald geswappt wird hat die Disk-Performance sehr wohl einen Einfluss.

Coda
2008-11-23, 16:46:43
Bei einem *offiziell* eingereichten SpecCPU-Wert wird ganz sicher nicht geswappt.

Avalox
2008-11-23, 16:59:20
AMD richtet sich grade eben neu aus.

Man sieht doch deutlich, dass AMD grade beim Shanghai grossen Wert auf Virtualisierung gelegt hat. Eigentlich ist dieses der grösste Fortschritt zu den bisherigen K10. Die Spec Werte tragen diesem überhaupt keine Rechnung. Wie auch?

Es ist doch müssig anzunehmen, dass AMD dort im High Performance Bereich (und verschiedenen anderen Bereichen) in den nächsten Jahren Intel Paroli bieten kann.

A.S. schreibt es doch sehr schön in den aktuellen Pozessorgeflüster

Gast
2008-11-23, 18:15:11
@coda: dann erklär doch bitte wie es zu solchen Ergebnissen kommt? (ernst gemeinte Frage)

Coda
2008-11-23, 19:40:02
Weiß ich nicht, aber es ist sehr weit hergeholt, dass es an der Harddisk liegen soll.

S940
2008-11-23, 23:42:38
@coda: dann erklär doch bitte wie es zu solchen Ergebnissen kommt? (ernst gemeinte Frage)
Um welche Resultate gehts denn jetzt genau ?
Hast Du Direktlinks zu Spec ?
Das kann auch einfach ein neuer Compiler, RAM, OS, etc. sein.

ciao

Alex

Gast
2008-11-26, 00:15:12
darum geht's: http://www.amdzone.com/phpbb3/viewtopic.php?f=52&t=135802&st=0&sk=t&sd=a&hilit=fugger&sid=68ef14444434a7eeda25e4a23d008076#p147587

S940
2008-11-26, 02:58:25
darum geht's: http://www.amdzone.com/phpbb3/viewtopic.php?f=52&t=135802&st=0&sk=t&sd=a&hilit=fugger&sid=68ef14444434a7eeda25e4a23d008076#p147587
Mann haben die Tomaten auf den Augen ? Das eine Sys ist 32bit, das andre 64 ... das eine hat 4x1 GB DDR3-1333, das andre 8x2 GB FBD2-800, das eine ist Vista das andre Linux ...

Aber ne klar, der Unterschied liegt an der ollen Intel Flash Disk ...:crazy2: :crazy2:

http://www.spec.org/cpu2006/results/res2008q4/cpu2006-20081024-05696.html
http://www.spec.org/cpu2006/results/res2008q4/cpu2006-20081013-05589.html

http://www.spec.org/cpu2006/results/res2008q4/cpu2006-20081024-05694.html
http://www.spec.org/cpu2006/results/res2008q4/cpu2006-20081013-05593.html

ciao

Alex

AffenJack
2008-11-30, 11:18:32
nen kleiner linpack bench i7 gegen shanghai von anandtech, mehr ergebnisse von ihnen zum shanghai sollten wohl in nächster zeit kommen.

http://images.anandtech.com/graphs/amdshanghai_112208120910/17839.png

http://www.anandtech.com/weblog/showpost.aspx?i=528

reunion
2008-11-30, 11:45:15
Der Vergleich ist unfair, da man hier schon am Opteron sieht wie wichtig der Speicher für die Linpack-Performance ist, und natürlich der Nehalem Desktop-Prozessor mit seinen unbuffered RAM Latenz-und Bandbreitenvorteile ggü. dem Opteron mit buffered RAM hat. Aber witzig das hier HT die Leistung derart senkt.

BlackBirdSR
2008-11-30, 13:37:36
Aber witzig das hier HT die Leistung derart senkt.

Das alte Problem: Threads werden munter ziwschen den logischen Kernen umhergeschoben. Der entstehende Aufwand und die geteilten Resourcen erzeugen dann Mali für Single-Thread-Ausführung.

Die sind aber relativ gering und eigentlich vernachlässigbar bei solch hohen werten

Trap
2008-11-30, 13:46:54
Der Vergleich ist unfair
Stimmt, der Speicher ist aber nur ein Aspekt. Einen Linpack-Vergleich mit dem Benchmarktool von Intel zu machen ist absurd.

Selbst wenn es die Intelversion schneller ist als AMDs Alternative, heißt das noch lange nicht, dass der Benchmark fair ist.

AffenJack
2008-11-30, 16:21:56
Das alte Problem: Threads werden munter ziwschen den logischen Kernen umhergeschoben. Der entstehende Aufwand und die geteilten Resourcen erzeugen dann Mali für Single-Thread-Ausführung.

Die sind aber relativ gering und eigentlich vernachlässigbar bei solch hohen werten

Es ist kein single thread, linpack ist multithreaded und nutzt threads sehr gut aus.
Die erklärung für das verhalten lässt sich aber in den comments finden.
I also would guess that since LINPACK was so optimized, it would keep the FPU/SSE unit busy full time. With HT that single FPU/SSE unit will be shared between 2 threads, thus queueing occurs. This would delay somewhat if one thread had to rely on the other thread to finish a calculation to continue (dependancy). And if both of those threads are on the same core, that would be some delay. In other applications like those 3D renderers, each thread is highly independant (no dependancy on other threads) and that would make a difference.
Ah! It has been staring me right in the face, thanks for pointing that out. Linpack is known to have ultra high IPC (I believe it is probably between 2 and 3, will give it a shot). There is simply "no room" anymore for a second thread: the other thread is fully using the FP ports.

S940
2008-11-30, 19:30:54
Selbst wenn es die Intelversion schneller ist als AMDs Alternative, heißt das noch lange nicht, dass der Benchmark fair ist.
Was wär denn dann "fair" ? Ein Vergleich mit der langsameren AMD Version :confused:

Wenns nichts anderes gibt, gibts nichts anderes, ist dann auch sogar ziemlich realitätsnah ... für sein eigenes HPC Projekt wird man kaum seinen eigenen Compiler / Math Lib. programmieren ... da nimmt man das, was es gibt.

@AffenJack:
Normalerweise gibts es *immer* Wartezeiten eines Threads auf den Hauptspeicher, in dem dann die Units brach liegen, und somit durch den 2ten Thread genutzt werden können. Wäre es möglich, dass die Latenzen bei Linpack schon durch die Prefetcher & Sprungvorhersagen 100% eliminiert werden ?? Wäre das erstemal ...

ciao

Alex

BlackBirdSR
2008-11-30, 23:46:17
gibt.

@AffenJack:
Normalerweise gibts es *immer* Wartezeiten eines Threads auf den Hauptspeicher, in dem dann die Units brach liegen, und somit durch den 2ten Thread genutzt werden können. Wäre es möglich, dass die Latenzen bei Linpack schon durch die Prefetcher & Sprungvorhersagen 100% eliminiert werden ?? Wäre das erstemal ...

ciao

Alex

Gleitkomma ist viel weniger von Branching und Latenzen abhängig als Integercode. In diesem Fall sind insbesondere die FPU/SIMD-Einheiten gefragt. Und da lässt sich mit entsprechendem Code schon einges erreichen. Immerhin wird da hoch optimiert. Allerdings sind viele Gleitkommaoperationen nicht unbedingt 1 cycle Operationen, nicht jeder Schritt vollständig pipelined und es gibt Grenzen bei Schedulern und Warteschlangen. Und wie richtig gesagt wurde, diese halbieren sich mit SMT zu großen Teilen. Es sollte für Core daher kein so großes Problem sein, die benötigten Daten schnell genug bereitzustellen. Ich gehe auch davon aus, dass die meisten Befehle in kleineren Loops zu finden sind.

S940
2008-12-01, 00:00:55
Hmm, auch wieder wahr, das Matrizenberechnen könnte wirklich der Ideal/Extremfall sein. Was andres bleibt eigentlich ja auch gar nicht übrig, was soll sonst bremsen :)

Kann man dann sagen, dass SpecFP ist eher nicht 100% FP ist bzw. größere Schleifen hat ?
Da bringt SMT ja noch was.

ciao

Alex

BlackBirdSR
2008-12-01, 02:14:28
Hmm, auch wieder wahr, das Matrizenberechnen könnte wirklich der Ideal/Extremfall sein. Was andres bleibt eigentlich ja auch gar nicht übrig, was soll sonst bremsen :)

Kann man dann sagen, dass SpecFP ist eher nicht 100% FP ist bzw. größere Schleifen hat ?
Da bringt SMT ja noch was.

ciao

Alex

SpecFP ist ne Ansammlung verschiedenster Algorithmen, von denen einige extrem Bandbreitenlastig sind. Schau dir einfach mal die Einzelergebnisse an, dann kannst dir ein Bild davon machen, wo was genau hilft.

Schrotti
2008-12-01, 02:27:37
Keine Lust die ganzen Seiten zu durchsuchen aber gibt es denn nun schon einen vernünftigen Bench zu Games?

Der Theoretische Müll (Server blabla) ist mir egal.

stav0815
2008-12-01, 10:33:33
Keine Lust die ganzen Seiten zu durchsuchen aber gibt es denn nun schon einen vernünftigen Bench zu Games?

Der Theoretische Müll (Server blabla) ist mir egal.

Warum sollte man eine Server-CPU mit Games benchen? Um herauszufinden dass sie langsamer ist als eine - fast gleiche - Desktop CPU?
Dazu braucht man keine Games.

AffenJack
2008-12-01, 19:11:17
mal nochn neues review, was ich gerade gefunden hab.

Techreport Shanghai Review (http://techreport.com/articles.x/15905)

Weselchak-U
2008-12-01, 22:37:50
an Schrotti

Einen kleinen Vorgeschmack gibt es z.B. hier : http://www.gamestar.de/hardware/tests/prozessor/1951268/amd_phenom_ii_x4.html :tongue:

S940
2008-12-01, 23:13:39
SpecFP ist ne Ansammlung verschiedenster Algorithmen, von denen einige extrem Bandbreitenlastig sind. Schau dir einfach mal die Einzelergebnisse an, dann kannst dir ein Bild davon machen, wo was genau hilft.
Thx, werd ich machen :)

Edit:
Linpack Teil2:
http://www.anandtech.com/weblog/showpost.aspx?i=529

AffenJack
2008-12-23, 14:13:44
neuer anandtech artikel eher mit dem fazit das shanghai gleichpreisige xeons in allen wichtigen bereichen plattmacht bis der nehalem im märz kommt:
http://it.anandtech.com/IT/showdoc.aspx?i=3484&p=1

Lawmachine79
2008-12-23, 15:05:23
neuer anandtech artikel eher mit dem fazit das shanghai gleichpreisige xeons in allen wichtigen bereichen plattmacht bis der nehalem im märz kommt:
http://it.anandtech.com/IT/showdoc.aspx?i=3484&p=1
Ist es wahrscheinlich, daß man dieses Ergebnis zwar nicht 1:1, aber tendenziell auf den Desktopbereich übertragen kann?

AffenJack
2008-12-23, 16:18:20
wohl kaum, die benches zeigen wohl mehr, dass der fsb bei noch viel mehr serveranwendungen als gedacht der limitierende faktor ist bei intel, sonst würde man sicher nicht so klar vor dem 3ghz Harpertown liegen. Da der fsb im desktop aber kaum limitiert, ist die vergleichbarkeit natürlich kaum gegeben.

In meinen augen ist der test auch um einiges realitätsnäher als die meisten anderen tests und auch der aufwand dahinter war sicher um einiges größer. Wobei selbst diese testarten wohl teilweise bald veraltet sein müssten, wenn man sich die anteile von mit VMs betriebenen Servern anguckt. Laut Anandtech warn das 2007 33% aller neu gekauften server und 2008 werden 50% erwartet. Daher müsste man in meinen Augen bald dazu übergehen einige tests über die VM laufen zu lassen, was den Vorsprung von amd wohl noch um einiges vergrößern sollte. Mal gucken was part2 von anands test dazu bringt.

Wurde eigentlich irgendwo anders mal was zum termin des nehalems im serverbereich gesagt außer q1? In dem Anand-Artikel geht man ja felsenfest vom März aus, was mir auch noch nicht bekannt war.

S940@Gast
2008-12-24, 11:09:02
wohl kaum, die benches zeigen wohl mehr, dass der fsb bei noch viel mehr serveranwendungen als gedacht der limitierende faktor ist bei intel, sonst würde man sicher nicht so klar vor dem 3ghz Harpertown liegen. Da der fsb im desktop aber kaum limitiert, ist die vergleichbarkeit natürlich kaum gegeben.

In meinen augen ist der test auch um einiges realitätsnäher als die meisten anderen tests und auch der aufwand dahinter war sicher um einiges größer. Wobei selbst diese testarten wohl teilweise bald veraltet sein müssten, wenn man sich die anteile von mit VMs betriebenen Servern anguckt. Laut Anandtech warn das 2007 33% aller neu gekauften server und 2008 werden 50% erwartet. Daher müsste man in meinen Augen bald dazu übergehen einige tests über die VM laufen zu lassen, was den Vorsprung von amd wohl noch um einiges vergrößern sollte. Mal gucken was part2 von anands test dazu bringt.

Wurde eigentlich irgendwo anders mal was zum termin des nehalems im serverbereich gesagt außer q1? In dem Anand-Artikel geht man ja felsenfest vom März aus, was mir auch noch nicht bekannt war.
Zum FSB:
Seh ich auch so, das bremst, ist ja nichts Neues, Intel übernimmt nicht ohne Grund IMC & QPI ...
Problem ist ausserdem, dass es ein Servertest ist, die Serversoftware ist auch viel anspruchsvoller was Caches und/oder RAM Latenzen anbelangt. Dir 08/15 Desktopsachen passen meist immer in die Intel L2 Caches und multithreaded ist ebenfalls nicht viel ...

Zu Q1:
Naja bei Q1 geht man immer automatisch von März aus, schlicht und ergreifend wegen der cebit. Man darf eber nicht vergessen, dass da nur die 2P Nehalem Xeon kommen, die MPs kommen in Q3.

ciao

Alex

Gast
2009-01-03, 11:51:16
2 Nehalem XEONs reichen ja auch aus um 4 Shanghais zu schlagen:

http://www.heise.de/ct/09/02/016/

Gast
2009-01-05, 14:21:07
2 Nehalem XEONs reichen ja auch aus um 4 Shanghais zu schlagen:

http://www.heise.de/ct/09/02/016/
wobei das ein assi-vergleich ist - die blades sind nie gleich effizient wie ein 2HE server

SavageX
2009-01-05, 14:32:51
Um wieder in Schlagweite zu kommen muss AMD dem Opteron sechs Kerne spendieren (Istanbul) und ein bisschen am Takt drehen. Was für ein Glück für AMD, dass ein K10.5 Kern so klein ist - damit bliebe man noch etwas unter 300 mm^2.

Das Duell zwischen 4 Kerne/8 Threads und 6 Kerne/6 Threads dürfte im Falle vom SAP-SD dennoch deutlich an den Prozessor mit den meisten Threads gehen. Schliesslich gibt es da nicht "viel zu rechnen", sondern es müssen "nur" kleine Handschläge pro Anfrage gemacht werden. Spannender wird es vielleicht beim "richtigen" Rechnen.

Gast
2009-01-05, 14:34:21
wobei das ein assi-vergleich ist - die blades sind nie gleich effizient wie ein 2HE server

Mit welcher Begründung?
Die CPU-Leistung ist ja wohl kaum von der Bauhöhe eines Server abhängig.

Gast
2009-01-05, 15:04:19
Mit welcher Begründung?
Die CPU-Leistung ist ja wohl kaum von der Bauhöhe eines Server abhängig.
ein 4x4 blade wird entweder per glasfaser verbunden, oder über ein internes interface, auf jeden fall weniger effektiv als "ein" mobo.

Gast
2009-01-05, 15:42:17
ein 4x4 blade wird entweder per glasfaser verbunden, oder über ein internes interface, auf jeden fall weniger effektiv als "ein" mobo.

Es ist aber nur ein Mobo, das die 4 CPUs aufnimmt.

Gast
2009-01-05, 16:20:56
Es ist aber nur ein Mobo, das die 4 CPUs aufnimmt.
hab mich verkuckt, hast recht - ist nur ein blade mit 4 cpus drauf. krass dass es die mittlerweile gibt (als single slot) - > sind immerhin um die 300w gesamthafter TDP.

_DrillSarge]I[
2009-03-23, 19:21:35
http://www.worlds-fastest.com/wfz974.html
"The AMD based server beat the Intel based server in our tests. We processed millions of transactions against a real database and we measured the total throughput and the total power used by the servers. We are certain of the accuracy of our test results and we provide our customers with a money back guarantee. If a system under-performs in the real world, we will take it back and refund the purchase price." commented Neal Nelson, president of the consulting firm.

The servers were tested with three different transaction workloads: a calculation intensive workload, a disk I/O intensive workload and the "idle" state when the server was powered up and waiting for transactions to arrive. The entire test suite was run twice, first with 4 gigabytes and then with 16 gigabytes of main memory.

For the calculation intensive workload the Opteron reported 1.0 to 6.3 percent higher throughput. The disk intensive throughput tests ranged from 1.1 percent favoring the Xeon to 5.0 percent favoring the Opteron. The power consumption, however, favored the Opteron in every test with a range of 13.1 to 20.8 percent. When the power readings were normalized by throughput the Opteron advantage ranged from 21.8 to 26.8 percent.

The servers used in this test had virtually identical configurations. The only notable differences were that the Intel server had an 8 percent faster clock frequency with 2.5 versus 2.31 gigahertz, and the Intel server used "Fully Buffered" memory modules (FB-DIMMs).

Nelson has observed that for several years Intel has been asserting that it's central processing units (CPUs) are more power efficient than comparable CPUs from AMD. Intel, however, does not discuss the fact that, for the current generation of Xeon server CPUs, the Intel architecture requires an external memory controller chip as part of the server chipset (this is not required for the AMD CPUs) and that Intel mandates the use of FB-DIMM-based memory technology which draws more power than the DDR2 memory technology used by AMD processor-based servers.

The net effect of these architectural differences is that an Intel based server can draw more power at the platform-level when compared to an AMD based server that delivers comparable throughput. A server's total throughput and total power consumption are much more important than whether some individual computer chip consumes more or less power.

The Nelson test results should not be confused with power usage test results from the Standard Performance Evaluation Corporation (SPEC). The SPECPower test was created by a committee of engineers from computer manufacturers (including Intel). SPEC issues a disclaimer which specifically states that the test results may not predict real world experiences. The Nelson test was designed and executed entirely by an independent computer consultant and Nelson offers a money back guarantee of its accuracy.

Nelson's firm has over 35 years experience providing data processing consulting services to some of the world's largest computer customers including the U.S. Army, U.S. Navy, the Internal Revenue Service, McDonalds, WalMart and Federal Express. Nelson operates a benchmarking laboratory that is available to commercial and government users for independent computer performance tests.

reunion
2009-04-22, 07:47:51
AMD stellt Vier-Kern-Prozessor mit 40 Watt vor:
http://www.computerbase.de/news/hardware/prozessoren/amd/2009/april/amd_vier-kern-prozessor_40_watt/

Tarkin
2009-04-22, 08:29:09
http://techreport.com/discussions.x/16790

insgesamt 12 neue Modelle... 3.1GHz (105W) stellen nun die Spitze dar

Gast Hitcher
2009-04-22, 09:04:20
für +200 MHz (ca. +7%) gleich 30W mehr Stromverbrauch?

Das verheißt für den kommenden 3,2GHz Phenom2 Vierkerner auch nichts gutes.
Angeblich soll der ja (auch) als 125W TDP Modell kommen (nicht ACP).

Poweraderrainer
2009-04-22, 10:42:30
Ist doch klar, dass hier ab einer bestimmten Taktung die 75W überschritten werden und nicht plötzlich 30W oben drauf kommen. Wenns für 75W nicht mehr reicht, muss man halt in die nächsthöhere, in dem Fall die 105W Kategorie - logisch, oder?
95W hätte sich allerdings besser angehört - da würden die 3,1GHz-Modelle mit Sicherheit auch noch reinpassen.