PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Diskussion zu: Launch-Analyse AMD Ryzen Threadripper


Leonidas
2017-08-15, 20:14:43
Link zum Artikel:
https://www.3dcenter.org/artikel/launch-analyse-amd-ryzen-threadripper

5CH4CHT3L
2017-08-15, 20:55:14
Sieht ja alles ganz ok aus.
Ich tippe mal für die non-X Modelle 100$ weniger, das würde dann auch das P/L Verhältnis aufbessern (da gleiche Perf. durch OC)

Auch super das AMD mal wieder einen ordentlichen Launch hingekriegt hat.

cat
2017-08-15, 21:45:40
Super Artikel, danke.

Der Einwand mit der heroischen Idee SMT statt Kerne abzuschalten ist klasse und war einer der Punkte wo ich an den tollen Hardware-Reviewern weltweit stark angefangen hab zu zweifeln.
Auch der vermisste Gegentest zum NUMA in Anwendungen, was soll ich sagen, VOLLTREFFER.

Was soll man zu jemandem sagen der nur darauf zocken will, ohne CPU-Streaming und parallele Anwendungen?
1. Zen hat etwa 10% weniger IPC als Skylake und KabyLake was man in Games merkt.
2. CPUs mit deutlich über 4GHz sind in Games eher das Mittel der Wahl.
3. Ein i7-7700K ist auch in näherer Zukunft für Zocken-only eine bessere Wahl trotz nur 8 Threads, und Games die von mehr Threads profitieren kann man aktuell noch an einer Hand abzählen.

Threadripper ist für Leute die Power für "Hypertasking" brauchen und da ist er verdammt gut.

MrSpadge
2017-08-16, 00:10:27
Somit sehen wir derzeit keinerlei Wert in Spiele-Benchmarks zu Threadripper, welche auf dem "Game Mode" (NUMA-Modus samt Deaktivierung der Hälfte der CPU-Kerne) basieren. Um überhaupt unter störrigen Spielen Benchmark-Werte erzeugen zu können, ist die Kern-Deaktivierung nur für diese Spiele-Titel derzeit sicherlich notwendig (eine wenig beachtete Alternative hierzu: nicht CPU-Kerne abschalten, sondern schlicht SMT deaktivieren) – aber als generellen benutzten Modus ist das ganze reichlich irrational. Dies würde bedeuten, das man einen 16-Kerner (für eine gute Stange Geld) kauft, nur um diesen dann als Achtkerner einzusetzen.
Du hast Recht, dass das so vollkommener Blödsinn wäre. Aber schau mal bei Anandtech (http://www.anandtech.com/show/11697/the-amd-ryzen-threadripper-1950x-and-1920x-review/4)nach - die sagen explizit, dass der Game Mode SMT deaktiviert und damit die Hälfte der logischen Kerne, nicht der physischen Kerne. Dazu passt auch die Leistungsaufnahme: Unter Volllast im Game Mode zieht der 1950X immernoch nahe seiner TDP (knapp 170 W), was ein einzelner Zeppelin mit 8 Kernen nicht im Ansatz erreicht.

Auch finde ich die Analyse "Game vs. Creator Mode" für Spiele dort recht gelungen: link (http://www.anandtech.com/show/11697/the-amd-ryzen-threadripper-1950x-and-1920x-review/20)
Es ergibt sich ein sehr differenziertes Bild, welches von "egal" bis "88% schneller" (GTA V in FHD, 99% Perzentil) reicht.

MrS

nikk
2017-08-16, 00:49:46
Das würde erklären, warum im Game Mode der 1950X@3.9 bis zu 11% schneller als ein 1800X@4.0 sein kann:
http://www.tomshardware.de/threadripper-gaming-workstation-leistungsaufnahme-temperaturen,testberichte-242381-13.html

In anderen Benchmarks ist der Unterschied nicht ganz so groß aber auch vorhanden. Vielleicht profitiert TR hier auch von der doppelten Speicherbandbreite.

Daredevil
2017-08-16, 01:14:53
Und bestimmt auch von den niedrigeren Temperaturen.
Ein Prozzi mit abgeschaltetem SMT/HTT bleibt schon ne Ecke kühler, vielleicht kann TR deswegen ja auch höher boosten.

Gast im besten Forum
2017-08-16, 01:18:54
Sehr guter Artikel, danke dafür :-)

AMD ist zurück an der "Spitze" (wenn man das so sagen darf, HEDT oder was für Begriffe man dafür nennen mag), was für ein Paukenschlag!
Damit hatte vor dem Ryzen Launnch bestimmt keiner mehr gerechnet, jedenfalls nicht in der Kürze der Zeit.

FlashBFE
2017-08-16, 10:51:04
Leo hat Recht damit, dass der Reboot die eigentliche Spaßbremse am Gamemode ist. Hätte es AMD irgendwie hinbekommen, den Gamemode im laufenden Betrieb umzuschalten und auch eine gewisse Automatik wie die Spieleverwaltung im Crimson-Treiber eingebaut, dann wäre das ein Top-Feature gewesen, das den Spielevorteil von CoreX deutlich kleiner gemacht hätte. So unwichtig dieser Spielevorteil für HEDT-CPUs auch sein mag, stört er doch gehörig die "Optik".

Vielleicht profitiert TR hier auch von der doppelten Speicherbandbreite. Unwahrscheinlich, weil gerade im NUMA-Modus ja vorzugsweise nur der jeweils lokale Speicher verwendet wird, also im Wesentlichen auch nur die gleiche Speicherbandbreite wie Ryzen.

stei.f
2017-08-16, 11:03:04
Unwahrscheinlich, weil gerade im NUMA-Modus ja vorzugsweise nur der jeweils lokale Speicher verwendet wird, also im Wesentlichen auch nur die gleiche Speicherbandbreite wie Ryzen.
Interessanter Punkt. Mit der Speicherbandbreite. Die Frage ist aber ob Spiele besser auf Bandbreite oder Latenz ansprechen. Weil beides gibt es nicht aus einem Thread (unter den Bedingungen welche Threadripper bereitstellt).

Ich hab einen Thread erstellt der den Artikel kommentiert. Ich find es fair den hier zu erwähnen. Da wolle ich genau das Thema mit dem Speichermodes ansprechen.
https://www.forum-3dcenter.org/vbulletin/showthread.php?p=11462509#post11462509

MrSpadge
2017-08-16, 11:05:13
Unwahrscheinlich, weil gerade im NUMA-Modus ja vorzugsweise nur der jeweils lokale Speicher verwendet wird, also im Wesentlichen auch nur die gleiche Speicherbandbreite wie Ryzen.
Das macht aber jeder Thread für sich. Sobald es 2 davon gibt und das OS sie halbwegs geschickt verteilt (jeweils eine Hälfte auf einen NUMA-Knoten), dann steht in Summe die doppelte Bandbreite zur Verfügung. Und die Threads blockieren sich weniger gegenseitig beim Speicherzugriff als beim R7.

MrS

Wörns
2017-08-16, 13:17:35
Ich bin nicht glücklich über den Artikel.
Der TR zielt doch überhaupt nicht auf Spiele ab.
Auch wenn das hier ein Forum ist, wo es vor allem auf Spieleperformance ankommt, kann man das doch nicht einfach ignorieren.
Es kommt mir so vor, als wenn man einen LKW bei einem Autorennen mitfahren lässt und dann den weisen Schluss zieht, dass man sich die hohen Kosten des LKW hätte sparen können zugunsten eines Ferraris.
Der Threadripper ist doch für ganz andere Lasten geschaffen worden als Spiele, nämlich parallelisierbare Lasten. Sagt schon der Name. Und das Thema IO ist nur am Anfang theoretisch angesprochen worden, dabei macht das genau einen der Punkte aus, wegen derer man eben mehr Geld ausgibt als für einen Standardprozessor auf einer Standardplattform. Entsprechend am Ziel vorbei gehen auch die Vergleiche der Prozessorkosten, ohne die viel höheren Plattformkosten der Highendlösungen mit zu berücksichtigen.

Ich hätte mir erwartet, dass Leo die Tests aus dem Feld heraussucht, die überhaupt was zum Thema parallele Lasten beitragen. Inwiefern sich der TR zum Spielen eignet, kann man unter "ferner liefen" natürlich auch erwähnen, zu dem Zweck dass kein Spieler enttäuscht wird, weil er sich die falsche Plattform gekauft hat. Aber es sollte angemessenerweise eine Randnotiz bleiben und nicht Hauptthema des Launchreviews.
MfG

FlashBFE
2017-08-16, 15:22:53
Das macht aber jeder Thread für sich. Sobald es 2 davon gibt und das OS sie halbwegs geschickt verteilt (jeweils eine Hälfte auf einen NUMA-Knoten), dann steht in Summe die doppelte Bandbreite zur Verfügung. Und die Threads blockieren sich weniger gegenseitig beim Speicherzugriff als beim R7.

MrS
Bei mehreren Prozessen könnte das vielleicht klappen, aber ich denke nicht, dass in einem Prozess mit mehreren Threads das Betriebssystem, das garnicht weiß, was das Programm als nächstes machen will, den Inhalt des Arbeitsspeichers immer in die Speichermodule verschiebt, die aktuell die geringste Latenz haben oder sogar die Daten doppelt hält. Das wäre ja bei dem Core-Hopping der Schedulers mit ständigem Datenverschieben verbunden. Ich vermute eher, dass einfach die Prozessaffinitäten so eingestellt werden, dass der Prozess auf dem Chip läuft, der aktuell den Speicherbereich mit den Daten den Prozesses verwaltet.

Der TR zielt doch überhaupt nicht auf Spiele ab.
Auch wenn das hier ein Forum ist, wo es vor allem auf Spieleperformance ankommt, kann man das doch nicht einfach ignorieren.
Es kommt mir so vor, als wenn man einen LKW bei einem Autorennen mitfahren lässt und dann den weisen Schluss zieht, dass man sich die hohen Kosten des LKW hätte sparen können zugunsten eines Ferraris.
Der Threadripper ist doch für ganz andere Lasten geschaffen worden als Spiele, nämlich parallelisierbare Lasten. Sagt schon der Name. Und das Thema IO ist nur am Anfang theoretisch angesprochen worden, dabei macht das genau einen der Punkte aus, wegen derer man eben mehr Geld ausgibt als für einen Standardprozessor auf einer Standardplattform. Entsprechend am Ziel vorbei gehen auch die Vergleiche der Prozessorkosten, ohne die viel höheren Plattformkosten der Highendlösungen mit zu berücksichtigen. Das ist alles richtig, aber die meisten Reviews testen trotzdem zu wenig Anwendungsbenchmarks, aber immer eine Hand voll Spiele dazu. Also warum soll man das nicht auswerten, gerade auf 3DC? Es wird ja auch oft genug erwähnt, dass die Prozessoren Geldverschwendung für reine Spiele-Maschinen sind. Interessanterweise sind aber alle aktuellen TR4-Mainboards (außer ASRock) an Spieler gerichtet, also selbst die Mainboardhersteller erwarten, dass Spieler die Hauptzielgruppe von TR sind. Warum das so ist, könnte mal ein Journalist recherchieren.

Dass die Plattformkosten komplett ausgelassen wurden und nur reine CPU-Preise verglichen wurden, was völlig falsche Schlüsse erzeugen kann, hat mich auch gestört, aber gerade die ersten TR4-Mainboards haben so abgehobene Preise, dass man da aktuell überhaupt keine sinnvolle Rechnung aufmachen kann. Bei AM4 kamen auch die ganzen HighEnd-Boards zuerst und die Standardware hinterher. Außerdem sind die Speicherpreise aktuell so hoch, dass man alleine für die doppelte Anzahl an Riegeln ordentlich extra hinblättert. Also wer ein TR4-System baut, der muss schon wissen, was er damit anfängt.

Gast
2017-08-16, 18:45:22
Das macht aber jeder Thread für sich. Sobald es 2 davon gibt und das OS sie halbwegs geschickt verteilt (jeweils eine Hälfte auf einen NUMA-Knoten), dann steht in Summe die doppelte Bandbreite zur Verfügung.


Der Sinn von NUMA ist ja gerade dem Betriebssystem bekanntzumachen welche Kerne auf welchen Speicher schnelleren Zugriff haben, damit möglichst alle Threads eines Prozesses auf den selben NUMA-Knoten scheduled werden.

Ein Prozess hat also im wesentlichen nur die Bandbreite eines einzelnen DIEs zur Verfügung, zumindest so lange es nicht so viele Threads gibt das die Kerne mehrere DIEs verwendet werden.

Mit NUMA verhält sich der Threadripper also pro Prozess weitestgehend wie ein einzelner Ryzen Prozessor.

Zu den Turbo-Modi muss auch noch einschränkenderweise gesagt werden, dass die höchste Turbostufe auf 4 Kernen nur möglich sind wenn jeweils 2 Kerne pro DIE verwendet werden.
Das bringt also auch einzelnen Anwendungen die wenige Threads auslasten nicht wesentlich was, erst wenn 2 Anwendungen parallel laufen die jeweils nur 2 Lastthreads benötigen bringt die Turbostufe einen echten Vorteil.

Weiters ist XFR bei Ryzen in jeder Turbostufe aktiv, auch der All-Core-Turbo wird (sofern die Bedingungen zutreffen) um die XFR-Stufe gegenüber dem "normalen" Turbo erhöht.

MrSpadge
2017-08-17, 00:19:56
Da könnt ihr Recht haben.. den Unterschied Prozess vs. Thread hatte ich nicht bedacht.

MrS

Gast
2017-08-17, 01:34:50
Moment ... Ich muss eben den Champagner aus dem Kühler holen, um Korken knallen zu lassen.

Ich feiere diesen Artikel gerade so sehr, dass ich Seitenstechen habe. Königlich. Ach was, kaiserlich.

Ach ja:
Einer der größten Vorteile von Threadripper bzw. X399 wurde glatt unterschlagen. 60 PCI-Lanes. Bei allen Varianten.
Intel hat sich absolut keinen Gefallen getan, seine Workstation-Schiene mit i7-7740X und i5-7640X 'abzurunden'. Selbst wenn es bei zwei Varianten geblieben wäre (28 & 44 Lanes) wäre AMD diesbzgl. weiter deutlich im Vorteil. Nicht nur bei der schieren Anzahl. Wenn ich lese, was für Klimmzüge, Verrenkungen, Beschränkungen, ... die LGA2066-Boards erfordern, kann das nur zu Fehlern führen.

MrSpadge
2017-08-17, 18:41:42
Du hast Recht, dass das so vollkommener Blödsinn wäre. Aber schau mal bei Anandtech (http://www.anandtech.com/show/11697/the-amd-ryzen-threadripper-1950x-and-1920x-review/4)nach - die sagen explizit, dass der Game Mode SMT deaktiviert und damit die Hälfte der logischen Kerne, nicht der physischen Kerne. Dazu passt auch die Leistungsaufnahme: Unter Volllast im Game Mode zieht der 1950X immernoch nahe seiner TDP (knapp 170 W), was ein einzelner Zeppelin mit 8 Kernen nicht im Ansatz erreicht.
Anandtech legt nach (http://www.anandtech.com/show/11726/retesting-amd-ryzen-threadrippers-game-mode-halving-cores-for-more-performance): sie lagen falsch und AMDs Game Mode deaktiviert tatsächlich die Kerne eines DIEs komplett. Damit wird's deutlich langsamer als mit 16C/16T und der maximale Stromverbrauch sinkt auf das Niveau des 1800X von ~125 W.

MrS

Gast
2017-08-17, 19:35:24
Dass die Plattformkosten komplett ausgelassen wurden und nur reine CPU-Preise verglichen wurden, was völlig falsche Schlüsse erzeugen kann, hat mich auch gestört, aber gerade die ersten TR4-Mainboards haben so abgehobene Preise, dass man da aktuell überhaupt keine sinnvolle Rechnung aufmachen kann. Bei AM4 kamen auch die ganzen HighEnd-Boards zuerst und die Standardware hinterher. Außerdem sind die Speicherpreise aktuell so hoch, dass man alleine für die doppelte Anzahl an Riegeln ordentlich extra hinblättert.
AMD hat überall so massiv an der Preisschraube gedreht, also die Zeit der Preis-Samariter bei denen ist jedenfalls vorbei.

Der Chipsatz ist auf dem gleichen Level wie der 370, gleicher Asic und trotzdem verlangt man massive Preissteigerungen wegen dem aufwendigen Sockel (ü 4000 Pins) und der Lanes, wobei einige x370 Platinen auch völlig überteuert sind wenn du da ein vernünftiges Board haben willst. Dann kommen sie bei TR jetzt mit Numamodes und all solch einem Zeug, weil die vielen Kerne gar nicht unterstützt werden. Das macht den Kauf so einer CPU ja stellenweise überflüssig.

Und Vega, aua...fette Preise schon noch paar Stunden, langsam, heiß, zu hoher Stromverbrauch. Hoffe AMD schießt sich nicht gerade selbst ab, weil vieles was die bringen (und zu solchen Preisen) einfach keinen Sinn macht, zu früh was Technologien angeht, nicht wirklich einsatzfähig für was es beworben wurde und stellenweise zu teuer für das Gebotene. Ich lehne mich zurück und genieße die Show, die Negativpresse ist am laufen. Das schlimmste was ich finde, das die keinen wirklich passenden Kühler für TR am Start haben. Was ist das bloss alles, nix scheint wirklich marktfähig zu sein, ausser Ryzen miitlerweile der auch viel zu früh kam.

Dann die ganzen Verzögerungen und Heimlichtuereien, wobei jetzt durch Tests das eine oder andere an die Öffentlichkeit gelangt, was eben doch nicht so positiv ist. Oh Oh...die haben sich mächtig verrannt. Wenn nVidia und Intel jetzt preislich reagieren dürften die mächtig unter Druck geraten. Ich glaube die Beine worüber sie straucheln stellen die sich schon wieder selbst und versuchen anfänglich die Deppen mitzunehmen. Je länger man zögert bei AMD bei einem Kauf umso mehr gewinnt die Konkurrenz, die haben ihr Absatzmarketing irgendwie nicht wirklich durchdacht. IMO soltlten sie einen neue Gen oder Arechitektur erstmal im Markt positionieren und etablieren um dann später an der Preisschraube zu drehen, die machen das mal gleich oder wenn und aber. Wahrscheinlich haben sie vor Intel und Nv die Hosen mächtig voll und versuchen mitzunehmen was geht. Das geht im Enthusiastmarkt nie auf, da sitzen ja nicht die Daus denen man sowas verkaufen kann, die informieren sich ja kaum.

y33H@
2017-08-17, 23:03:18
Anandtech legt nach (http://www.anandtech.com/show/11726/retesting-amd-ryzen-threadrippers-game-mode-halving-cores-for-more-performance): sie lagen falsch und AMDs Game Mode deaktiviert tatsächlich die Kerne eines DIEs komplett. Damit wird's deutlich langsamer als mit 16C/16T und der maximale Stromverbrauch sinkt auf das Niveau des 1800X von ~125 W.Höchst ungewöhnlich für Anandtech, aber sie haben in den vergangenen Monaten mehrfach Böcke geschossen. Neben dem Game Mode etwa auch der Artikel, dass Intel am 21. August die Coffee Lake für Desktop vorstellen wird - stattdessen ist es freilich Kaby Lake Refresh für Mobile.

Gast
2017-08-18, 19:26:47
Der Einwand mit der heroischen Idee SMT statt Kerne abzuschalten ist klasse und war einer der Punkte wo ich an den tollen Hardware-Reviewern weltweit stark angefangen hab zu zweifeln.


Spiele laufen teilweise sogar schneller wenn man sie an 1 CCX pinnt, weshalb auch davon auszugehen ist, dass Spiele auch dann besser laufen wenn man ein DIE komplett deaktiviert anstatt einfach auf SMT zu verzichten.