PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : AMD - Zen 5 (3/4 nm, 2024)


Seiten : 1 2 3 4 5 6 7 8 9 10 [11] 12 13 14 15 16 17 18 19 20 21

OC_Burner
2024-06-03, 16:19:58
Mal ganz spekulativ, da die Auflösung zu gering ist und sich der L2 vom L3 Cache sehr schwer unterscheiden läßt.

https://www.forum-3dcenter.org/vbulletin/attachment.php?attachmentid=88393&stc=1&d=1717424349

Gipsel
2024-06-03, 16:41:46
Cache nimmt relativ gesehen 15% weniger Fläche ein, die Kerne entsprechend ein wenig mehr (Interface sieht recht ähnlich aus) und man kommt am Ende bei sehr ähnlicher CCD-Größe raus.

davidzo
2024-06-03, 17:04:46
Ein solcher Vergleich über verschiedenen Fertigungsprozesse und Leistungsklassen hinweg ist wohl kaum sinnvoll. Auch Qualcomm liegt zumindest laut den AMD-Benchs deutlich hinten, bei ebenfalls 12 Cores und ganz ohne E-Cores.

https://i.postimg.cc/q79VY465/22-2160-03a39354.jpg (https://postimg.cc/zLScHmjC)

Deswegen ja auch über den gleichen Fertigungsprozess und gleiche Leistungsklasse (Power draw) mit M2pro vs Strix Point. Ich bin gespannt auf die Reviews.

Dass Qualcomm "Deutlich" hinten liegt bezweifle ich. 5% sind nicht viel und die 60% sind ein Grafikbenchmark, nicht CPU.
+30% bei CB R24 sind nicht schlecht, aber das war zu erwarten bei 24Threads vs 12 threads. Das sieht bei Hawk Point vs M3 auch bereits jetzt schon nicht anders aus und trotzdem würde niemand behaupten dass der 7840U der schnellere Prozessor ist als ein M3.

Es wird schon einen Grund gegeben haben wieso AMD nicht +15% Average oder so schreibt sondern sich 3 Einzelwerte und einen Grafiktest herauspickt.
Wer so geringe Unterschiede wie +5% mit auf die Folien schreibt, weiß dass es eigentlich eher Gleichstand steht.

Ich rechne damit dass Strix und Hamoa sich ein Kopf an Kopf rennen liefern und im Schnitt eine ähnliche performance abliefern.

Diese Benchmarks macht AMD mit festem Takt (z.B. fixen 4 GHz). Effektiv wird Zen5 bei gleichem Verbrauch vermutlich einen etwas höheren Takt in MT-Szenarien halten können als noch Zen4. Zumindest deuten die tendentiell gesunkenen TDP-Werte darauf hin.


Nicht wirklich, denn die Baseclocks sind auch gesunken. Der 9700X hat 100mhz mehr Turbo als der 7600X aber genau den gleichen Baseclock wie der 7600 vanilla.

Ich würde in die neuen 65W SKUs nicht zu viel bezüglich Turbo und Realverbrauch reininterpretieren. Das könnte auch einfach die neue SKU Strategie von AMD sein die bereits für den mobile markt geleakt wurde:
https://www.3dcenter.org/news/news-des-15-mai-2024
Starting from Strix Point, AMD will no longer distinguish between U, HS and H, but will use one SKU to take all the standard TDP 15W-45W, which helps to reduce the complexity of operation and testing. However, for users, the performance release level of different notebook computers cannot be simply distinguished through U/HS/H, and everyone must keep their eyes open. The name HX will be retained, but as you can see, the current HX is not the definition of HX in the past.

Man soart sich so einfach die Hälfte der SKUs, was die Logistik und das Binning vereinfacht.
Im Desktop hatten X- und non-X bisher wohl auch schon ein vergleichbares Binning. Mit PBO war der non-X ja auch kaum noch unterscheidbar von einem X. Die Turbocharakteristik ist in Zukunft womöglich eher abhängig von Board und EFI Settings.



Interessant wird, ob intel mit seinen kleinen Skymont-Kernen tatsächlich so viel Mehrperformance generieren kann, wie momentan durch die Gerüchteküche geistert. Ansonsten scheint auch Zen5 (wie Zen4) sehr kompakt gebaut zu sein, so daß man quasi immer mit mehr großen Kernen als intel antreten kann.
Da die geleakten Folien von Chips and Cheese als echt erachtet werden ist das Gerücht quasi geadelt: https://chipsandcheese.com/2024/05/30/thoughts-on-skymont-slides/

Ich halte +30% durchaus für realistisch wenn man das Frontend wirklich auf triple dreifach-decoder aufbohrt und den ROB, Register und qeues quasi auf Zen4 niveau anhebt. Die Doppelt breite FPU bringt dann halt die +68% in Floating point Benchmarks, aber das ist allerdings auch dringend nötig denn bei FP workloads liegt die Gracemont Architektur derzeit nur bei der Hälfte der P-Core performance oder Zen4.

Prinzenrolle
2024-06-03, 17:08:56
Für CPUs ist das sehr gut. Solche Steigerungen gab es eher selten. Ist halt kein Umstiegsgrund für Leute, die schon Zen 4 haben.

Naja, also wenn man zwischen den Zeilen liest/gelesen hat, sieht das alles schon ein bisschen gezwungen aus, wenn man mich fragt.
Es ist ja nicht umsonst so, dass man bis zuletzt aus Kreisen eigentlich von 10 bis 15% IPC Uplift ausging und gestern Mittag ein Vogel 16% zwitscherte, das werden "womöglich" finale Tests dann zeigen, dass die 16%
vielleicht etwas zu optimistische Angaben sind, besonders 1T. Wenn nicht mehr Takt dazukommt, sind die IPC Steigerungen alleine auch nicht so prall.

Die Gaming Werte gegen den 14900K hat AMD nicht nur ein bisschen geschönt.
Das sind ja fast schon Fantasiewerte mit durchschnittlich 13,1%. AMD scheint von ihrem Produkt nicht ganz so überzeugt zu sein.
Soviel ich vernommen habe, soll man gegen Arrow Lake weitgehend in den "Fanboythemen" wie Gamingleistung selbst mit den X3Ds leistungsmäßig scheitern. Bleibt spannend.

HOT
2024-06-03, 17:09:23
Wird sicherlich auch ein neues VCache-Die geben in N4 oder N5.

fondness
2024-06-03, 17:23:33
Soviel ich vernommen habe, soll man gegen Meteor Lake weitgehend in den "Fanboythemen" wie Gamingleistung selbst mit den X3Ds leistungsmäßig scheitern. Bleibt spannend.

LOL :D
Dagegen reicht schon ein Zen4.

Gipsel
2024-06-03, 17:27:00
Nicht wirklich, denn die Baseclocks sind auch gesunken. Der 9700X hat 100mhz mehr Turbo als der 7600X aber genau den gleichen Baseclock wie der 7600 vanilla.Der 7600er muß aber auch nicht bei einem AVX512-"Powervirus" den Baseclock erreichen. Bei normalem Code wird Zen5 vermutlich schon etwas höhere Takte fahren. Das trägt vermutlich zu dem etwas überproportionalem Zuwachs in MT-Szenarien bei.
Da die geleakten Folien von Chips and Cheese als echt erachtet werden ist das Gerücht quasi geadelt: https://chipsandcheese.com/2024/05/30/thoughts-on-skymont-slides/

Ich halte +30% durchaus für realistisch wenn man das Frontend wirklich auf triple dreifach-decoder aufbohrt und den ROB, Register und qeues quasi auf Zen4 niveau anhebt. Die Doppelt breite FPU bringt dann halt die +68% in Floating point Benchmarks, aber das ist allerdings auch dringend nötig denn bei FP workloads liegt die Gracemont Architektur derzeit nur bei der Hälfte der P-Core performance oder Zen4.Ehrlich gesagt ist da sehr viel Spekulation dabei, da man auf den Folien nicht wirklich was erkennen kann.
Achja, Skymont mag das Frontend um +50% aufbohren (von doppelten auf dreifache Decoderblöcke), aber man sieht ja an Zen5 (welcher von einem auf zwei parallele Decoderblöcke geht und somit volle +100% drauflegt), daß das auch nicht immer hilft (viel kommt ja aus dem µOp-Cache, der mehr liefern kann als die Decoder). ;)

Hatstick
2024-06-03, 18:05:47
Dann brauche ich mir dieses Jahr keine Gedanken zum Aufrüsten machen.
Sollte dann wohl schon der 9800X3D oder wie er heißen mag werden, drunter lohnt meiner Meinung nach überhaupt nicht vom 5800X3D, wenn man den kompletten Plattformwechsel in Betracht zieht.
Da bin ich aber auch gespannt, wie der 9800X3D sich dann ohne massiven 3D Cache Usage flat zum Intel Arrow Lake oder wie die nächste Intel Gen genau heißt so schlägt.
Der 5800X3D ist einfach toll für meinen alten AM4 Unterbau, beim aktuellen DDR5 Unterbau würde ich dann aber schon genau hinschauen, wie es im Mittel aussieht, weil ohne großen L3 Cache Usage fallen die dann zum Teil auch gut zurück oder anders gesagt... da wäre mir die L3 Cache Lotterie zu "unsicher", dann lieber in der Spitze etwas weniger aber flat homogener.
Abwarten und Tee trinken.

Hakim
2024-06-03, 18:31:25
Der 5800X3D hält auch noch sehr gut bei Games mit, braucht man nicht über Upgrade großartig nachdenken wie du schon sagst, evt mit dem 9800X3D.

Was ich mich aber immer Frage bei dem 5800X3D und auch 7800X3D, das sind 8 Kerner mit 16 Threads, wenn man die so normal laufen läßt haben die eine sehr gute Spiele Leistung da die Kerne vollkommen ausreichen (die Hardware Tester testen ja auch vermutlich so). Aber wenn mal wie eigentlich typisch bei einem Gamer PC, neben dem eigentlichen Spiel, im Hintergrund, Discord, Spotify, irgendein Game launcher, ein Browser mit zisch offenen Tabs, Outlook, ka noch ein WhatsApp Messenger und und und laufen hat, wie schauts da aus mit den 8 Kernen aus? Ob dann evt ein 7950X3D oder 14900K es besser machen?

Zossel
2024-06-03, 18:42:39
neben dem eigentlichen Spiel, im Hintergrund, Discord, Spotify, irgendein Game launcher, ein Browser mit zisch offenen Tabs, Outlook, ka noch ein WhatsApp Messenger und und und laufen hat, wie schauts da aus mit den 8 Kernen aus? Ob dann evt ein 7950X3D oder 14900K es besser machen?

Einfach mal den Ressourcenverbrauch ohne die Hauptanwendung (Spiel) anschauen. Das meiste von dem genannten Zeug wird eher wenig CPU verbrauchen.
IMHO kann man bei Windows ja nicht sehen wie viele tasks gerade in der runqueue auf CPU warten. Oder?

Daredevil
2024-06-03, 19:26:25
Es ist absolut selten bis kaum existent, das 8 Kerne inkl. HTT komplett ausgelastet werden, daher sind 8C im Schnitt überdimensioniert. Das sage ich dir als jemand, der von einem 5600X kommt. Wenn man nun natürlich CPU Decoding nebenbei macht oder wirklich CPU intensive Tasks, die gerne mal z.B. 50% der Ressourcen einnehmen, lohnen sich natürlich mehr Kerne. Ansonsten ist der Mehrwert vereinzelt da, aber zu vernachlässigen. Da hätte es sich mehr gelohnt, immer den schnellsten 6c zu kaufen, als einmal nen Threadripper 1950X für mehrere Generationen zu halten. Pro Kern Speed zählt imho immer noch deutlicher, sonst wäre Intel ja nicht vereinzelt in manchen Spielen vorne.

HW Unboxed hatte sich das hier mal angeschaut:
https://www.youtube.com/watch?v=0mO4op3bL90
https://s20.directupload.net/images/240603/7h4rnxfq.png

Lurtz
2024-06-03, 19:28:11
Was ich mich aber immer Frage bei dem 5800X3D und auch 7800X3D, das sind 8 Kerner mit 16 Threads, wenn man die so normal laufen läßt haben die eine sehr gute Spiele Leistung da die Kerne vollkommen ausreichen (die Hardware Tester testen ja auch vermutlich so). Aber wenn mal wie eigentlich typisch bei einem Gamer PC, neben dem eigentlichen Spiel, im Hintergrund, Discord, Spotify, irgendein Game launcher, ein Browser mit zisch offenen Tabs, Outlook, ka noch ein WhatsApp Messenger und und und laufen hat, wie schauts da aus mit den 8 Kernen aus? Ob dann evt ein 7950X3D oder 14900K es besser machen?
HWU haben das letztens mal in einem Q&A behandelt und meinten das wäre völlig irrelevant bei einem modernen Achtkerner.

Prinzenrolle
2024-06-03, 19:33:20
LOL :D
Dagegen reicht schon ein Zen4.

Gemeint war natürlich Arrow Lake.

mocad_tom
2024-06-03, 21:38:56
https://x.com/highyieldYT/status/1797516663996436783

fyi

davidzo
2024-06-03, 21:42:24
Der 7600er muß aber auch nicht bei einem AVX512-"Powervirus" den Baseclock erreichen. Bei normalem Code wird Zen5 vermutlich schon etwas höhere Takte fahren. Das trägt vermutlich zu dem etwas überproportionalem Zuwachs in MT-Szenarien bei.

Das mit dem Powervirus ist aber spekulativ. Bloß weil das bei der Intel Implementierung der Fall ist muss das bei AMD nicht so sein. War es nicht so dass der Vektorthroughput sowieso an der Cache Bandbreite hängt und Golden Cove daher eine viel höhere L2 und L3 Bandbreite hat als AMD, die in anderen Workloads brachliegt?
Ehrlich gesagt glaube ich nicht dass AMD sich die Blöße gibt den Intel Skandal zu wiederholen mit den abgesenkten Baseclocks. Das Cooper-Lake Fiasko hat intel richtig Markenimage gekostet weil die Server-CPUs plötzlich langsamer waren wenn irgend ein Vm guest AVX512 Code ausgeführt hatte.


Ehrlich gesagt ist da sehr viel Spekulation dabei, da man auf den Folien nicht wirklich was erkennen kann.
Achja, Skymont mag das Frontend um +50% aufbohren (von doppelten auf dreifache Decoderblöcke), aber man sieht ja an Zen5 (welcher von einem auf zwei parallele Decoderblöcke geht und somit volle +100% drauflegt), daß das auch nicht immer hilft (viel kommt ja aus dem µOp-Cache, der mehr liefern kann als die Decoder). ;)
Was hälsts du für spekuliert? Die Kern-Aussagen kann man gut genug erkennen.

Skymont hat auch keinen µOp$, daher scheint sich der triple decoder zu lohnen um die execution ports besser gefüllt zu halten.

Btw, bist du sicher dass Zen5 2x4-wide Decoder hat? Da steht ja nur "up to 2x". Es könnte auch lediglich eine größere Instruction cache Bandbreite gemeint sein und ein größerer µOp$. Der frühere Leak sagte ja auch "2x basic block fetch" und nichts über decode. Gibts da mehr Infos zu als diese sparsame "up to 2x" Folie?


Gemeint war natürlich Arrow Lake.

Da gibts ja bereits Leaks zu die ARL die einem ca. 11% Performancegewinn im Schnitt zeigen (und von Igor und anderen Industrievertrauten als echt eingeschätzt werden). Bis auf Floating Point das um 17-21% zunimmt. Letzteres ist wohl zu 100% auf die verdoppelten Floating-Einheiten in Skymont zurück zu führen. Was die IPC angeht kann man daran noch nichts fest machen da es lediglich auf 250TDP normiert ist. Auch die E-Cores, die ja einen 30% Sprung machen sollen werden einen großen Anteil an dem 11% Schnitt haben. Womöglich sind die Performancegewinne der P-Cores wieder kaum vorhanden und man nutzt bei LionCove die Chance um die FPU aufzuräumen und die PPA zu verbessern.

In Spielen sehe ich allerdings schwarz. 150ns DRAM Latenz ist kein gutes Rezeot für eine gaming CPU. In anderen Workloads sieht man das vielleicht nicht, aber in gaming ist das anders. Da nützen einem weder die schnelleren E-Cores, noch lohnt sich da die Chiplet Architektur die wir ja von MTL schon kennen. Das SOC Die ist ja das gleiche und damit wird sich auch and er Speicherlatenz nichts großartig ändern. Vermutlich wird weiterhin Raptorlake das beste sein was Intel für Gamer zu bieten hat in 2025.
Es gibt schon einen Grund wieso die neuen Asus Notebooks mit diskreter Grafik auf der Computex wie Tuf Gaming, ProArt, Zenbook S und G-Series auf der Computex mit Ryzen AI 300 kommen und nicht mit Intel.

Zossel
2024-06-03, 22:09:40
Das mit dem Powervirus ist aber spekulativ. Bloß weil das bei der Intel Implementierung der Fall ist muss das bei AMD nicht so sein. War es nicht so dass der Vektorthroughput sowieso an der Cache Bandbreite hängt und Golden Cove daher eine viel höhere L2 und L3 Bandbreite hat als AMD, die in anderen Workloads brachliegt?

Problem bei breiten Vectorunits ist wohl (Konjunktiv) die hohe switching-capacity auf engen Raum in den ALUs. Wenn die Stromversorgung da nicht mithält ist schnell Essig mit hohen Frequenzen.

latiose88
2024-06-03, 23:54:04
Die Gaming Werte gegen den 14900K hat AMD nicht nur ein bisschen geschönt.
Das sind ja fast schon Fantasiewerte mit durchschnittlich 13,1%. AMD scheint von ihrem Produkt nicht ganz so überzeugt zu sein.
Soviel ich vernommen habe, soll man gegen Arrow Lake weitgehend in den "Fanboythemen" wie Gamingleistung selbst mit den X3Ds leistungsmäßig scheitern. Bleibt spannend.

Bei Anwendung hat AMD es auch geschönt.Intels 14900k ist schneller als der 7950x,aber nur bei vollen Takt.Um rund 16 % schneller ist der 14900k gegenüber dem 7950x bei rund 5,6/5,7 ghz vs 5,1 ghz beim 7950x.Nun da bei Zen 5 gibt AMD gegenüber Intel 55 % bei Handbrake an verbesserung.Allerdings Ryzen 9 7950x vs 9950x soll es nur 11 % bei Handbrake sein.Da stimmt auf jedenfall was nicht.Eine so hohe Steigerung ist unwarscheinlich.Ergo hat AMD hier geschumellt oder geschönt.Ergo kann ich das Ergebnis nicht ernst meinen.Ich habe da ein ungutes Gefühl dabei auch wenn ich mir vorstellen kann das AMD in H265 mit 4k getestet hatte und ich nur in H264 mit HD und kleiner.ALso da kann es dann auch Unterschiede geben bei IPC.Ich lasse mich da also einfach überraschen.

latiose88
2024-06-04, 00:14:08
Achja, Skymont mag das Frontend um +50% aufbohren (von doppelten auf dreifache Decoderblöcke), aber man sieht ja an Zen5 (welcher von einem auf zwei parallele Decoderblöcke geht und somit volle +100% drauflegt), daß das auch nicht immer hilft (viel kommt ja aus dem µOp-Cache, der mehr liefern kann als die Decoder). ;)
Also auf gut Deutsch,je mehr man von der CPU verwendent,desto stärker die CPU,also 2 x die selbe Anwendung und es entsteht ein Vorteil weil damit die paralelle Decoderblöcke besser ausgelastet werden oder nicht?

madzapp
2024-06-04, 00:17:31
Die Differenz kann am Baseline Profil (oder wie das jetzt heisst) liegen .Soll ja bei hoher Auslastung viel ausmachen. Aber ja erste richtige Tests abwarten.

vinacis_vivids
2024-06-04, 01:54:12
https://x.com/AMDGPU_/status/1797660217737670968

9950X
Bis zu +56% Mehrperformance im MT ggü. Intel 14900K
Bis zu +23% schneller im Gaming

Vor allem die AVX512 Fähigkeit des 9950X thront über allem.

Intel-Fab kann schließen.

maximus_hertus
2024-06-04, 04:00:05
Intel-Fab kann schließen.

Warum?

w0mbat
2024-06-04, 07:08:30
Zumal LNL und die meisten ARL von TSMC gefertigt werden :D

Gipsel
2024-06-04, 08:25:45
Das mit dem Powervirus ist aber spekulativ. Bloß weil das bei der Intel Implementierung der Fall ist muss das bei AMD nicht so sein. War es nicht so dass der Vektorthroughput sowieso an der Cache Bandbreite hängt und Golden Cove daher eine viel höhere L2 und L3 Bandbreite hat als AMD, die in anderen Workloads brachliegt?Und jetzt rate mal, was Zen5 gegenüber Zen4 verdoppelt! Die Bandbreite vom L2 zum L1 und vom L1 zu den 512bit-Vektoreinheiten. ;)
Ehrlich gesagt glaube ich nicht dass AMD sich die Blöße gibt den Intel Skandal zu wiederholen mit den abgesenkten Baseclocks.Na die Baseclocks sind bei 65W TDP doch identisch zu Zen4, wie bereits festgestellt. Zen5 macht darin aber AVX512 mit doppeltem Durchsatz. Das war der Punkt. Ohne AVX512 bei "normalem" Code könnte also Zen5 tendentiell etwas höher takten als Zen4 bei gleicher TDP (bis man irgendwo bei 5,x GHz ins Taktlimit läuft, was zwischen Zen4 und Zen5 offenbar sehr ähnlich liegt).
Was hälsts du für spekuliert? Die Kern-Aussagen kann man gut genug erkennen.Die Slides sind verdammt blurry. Sogar Chips'nCheese sagen, daß das schwer zu erkennen ist und deswegen teilweise Speku ist.
Btw, bist du sicher dass Zen5 2x4-wide Decoder hat? Da steht ja nur "up to 2x". Es könnte auch lediglich eine größere Instruction cache Bandbreite gemeint sein und ein größerer µOp$. Der frühere Leak sagte ja auch "2x basic block fetch" und nichts über decode. Gibts da mehr Infos zu als diese sparsame "up to 2x" Folie?Das was Lisa Su gesagt hat, als die Folie kam: "We have a new parallel dual pipeline frontend", was eben zusammen mit dem "2x basic block fetch" sich grob so anhört, als wenn man sich von intels E-Cores hat inspirieren lassen (also ähnlich wie Gracemont (https://i0.wp.com/chipsandcheese.com/wp-content/uploads/2021/12/gmt_ifetch.png?ssl=1), nur eben fetter: 2x 32Byte Fetch [statt 2x 16Byte] mit mehr Decodern pro Pipeline und mit µOp-Cache obendrauf). Und auf der Folie bei der Computex stand "up to 2x instruction bandwidth", nicht "instruction cache bandwidth". Da können im Idealfall also doppelt so viele Instruktionen rauspurzeln (und daß man die µOp-Cach-Bandbreite verdoppelt, ist sehr zweifelhaft, weil Verschwendung [ist bei Zen4 schon mehr als doppelt so groß wie die der Decoder]).
Aber ich gebe Dir insofern recht, als daß das noch wenig handfest ist, insbesondere da AMD ja sagt, daß sie bei Zen5 vieles umgestellt haben. Also vielleicht ist es auch irgendwas Neues und das "parallel dual pipeline frontend" meint nicht 2 Kopien der Zen4-Decoder Pipeline. Wir werden es sehen.

Edit:
Zen4 war mit nur 4 Decodern schon erstaunlich schmal am Frontend für die Performance. Lioncove kommt offenbar mit 8 Decodern im Frontend (erhöht von 6 mit Raptor/Redwood), warum Zen5 dann nicht auch? Ich meine, Gracemont/Crestmont hat schon 6 Decoder und Skymont sogar 9 Decoder.

fondness
2024-06-04, 09:37:12
+30% bei CB R24 sind nicht schlecht, aber das war zu erwarten bei 24Threads vs 12 threads. Das sieht bei Hawk Point vs M3 auch bereits jetzt schon nicht anders aus und trotzdem würde niemand behaupten dass der 7840U der schnellere Prozessor ist als ein M3.


Warum würde das niemand behaupten? Dass der 7840U der schnellere Prozessor im MT ist als der M3 ist Fakt. Klar manchen Leuten ist der Geekbench-Score ein wenig zu Kopf gestiegen, aber das ist kein Argument.


Ich rechne damit dass Strix und Hamoa sich ein Kopf an Kopf rennen liefern und im Schnitt eine ähnliche performance abliefern.


Vielleicht rein bezogen auf 1T CPU-Performance, aber es gibt schon auch noch was anderes. Die GPU hat offenbar keine Chance gegen Strix und bei MT ist man durch fehlendes HT auch klar unterlegen wie Cinebench zeigt. Also unterm Strich ist Strix überlegen.

mboeller
2024-06-04, 09:38:42
....

IMHO: Bezogen auf die ganzen Änderungen die AMD in ZEN5 eingebracht hat erscheinen mir +16% IPC doch arg wenig zu sein. Ich hatte, auch im Bezug auf ZEN3 schon mit >25% IPC gerechnet. IMHO enttäuschend.

fondness
2024-06-04, 09:38:49
Strix Point (Ryzen AI 300 Series) via @highyieldYT X/Twitter (https://x.com/highyieldYT/status/1797516663996436783)
https://i.postimg.cc/z3q1RkMw/GPIP3-ZOa4-AAs-IWk.jpg (https://postimg.cc/z3q1RkMw)

Hier auch noch entzerrt:

https://i.postimg.cc/5yqxR1QV/image.jpg (https://postimages.org/)

https://x.com/fellix_bg/status/1797661462640685129

robbitop
2024-06-04, 11:38:58
Ich rechne damit dass Strix und Hamoa sich ein Kopf an Kopf rennen liefern und im Schnitt eine ähnliche performance abliefern.
GPU wird man sehr unwahrscheinlich auf Radeon Niveau kommen. (Treiber und Spieleoptimierungen - wie aufwändig das ist, hat Intel die letzten 2 Jahre gezeigt)
CPU hat QCOM den Nachteil, dass erstmal von ARM auf x86 translated werden muss.

IMHO: Bezogen auf die ganzen Änderungen die AMD in ZEN5 eingebracht hat erscheinen mir +16% IPC doch arg wenig zu sein. Ich hatte, auch im Bezug auf ZEN3 schon mit >25% IPC gerechnet. IMHO enttäuschend.
Naja Gesetz des sinkenden Grenzertrags. Schau dir mal an was Lion Cove in Lunar Lake alles ggü seinem Vorgänger ändert und holt damit auch nur +14% IPC heraus. :)

vinacis_vivids
2024-06-04, 11:50:42
Warum?


https://x.com/AMDGPU_/status/1797723549840617523

Introducing the worlds most powerful mobile APU:

Ryzen AI 9 HX 370

- 50 teraOps AI NPU��
- 16CU RDNA 3.5 GPU��
- 1.5x L3 cache (24MB)��
- 12 core (24 thread)
- +30% gaming perf vs X Elite
- +30% MT perf vs X Elite

https://www.amd.com/de/products/processors/laptop/ryzen/300-series/amd-ryzen-ai-9-hx-370.html

Huang baut lieber AI only und überlässt Su den mobilen Markt komplett.

fondness
2024-06-04, 11:59:47
https://x.com/AMDGPU_/status/1797723549840617523

Introducing the worlds most powerful mobile APU:

Ryzen AI 9 HX 370

- 50 teraOps AI NPU��
- 16CU RDNA 3.5 GPU��
- 1.5x L3 cache (24MB)��
- 12 core (24 thread)
- +30% gaming perf vs X Elite
- +30% MT perf vs X Elite

https://www.amd.com/de/products/processors/laptop/ryzen/300-series/amd-ryzen-ai-9-hx-370.html

Huang baut lieber AI only und überlässt Su den mobilen Markt komplett.

BTW, das einzig leicht enttäuschende jetzt wo man sieht das Intel LL nur wenig später in TSMC N3B fertig ist der nach wie vor verwendete TSMC 4nm Prozess. Hier wäre 3nm offensichtlich durchaus möglich gewesen.

vinacis_vivids
2024-06-04, 12:08:46
BTW, das einzig leicht enttäuschende jetzt wo man sieht das Intel LL nur wenig später in TSMC N3B fertig ist der nach wie vor verwendete TSMC 4nm Prozess. Hier wäre 3nm offensichtlich durchaus möglich gewesen.

3nm ist zu teuer, weil Huang die Kapazitäten schon vorreserviert hat. AMD muss mit dem Floorplan und 4nm besser umgehen als der verschwenderische Huang mit 3nm und seinem KI-Wahn.

Intel zerrt ja schon an Deutschen Steuergeldern um überhaupt mithalten zu können, trotz besserer Fertigung (TSMC N3B).

Gipsel
2024-06-04, 12:35:51
Hier auch noch entzerrt:

https://i.postimg.cc/5yqxR1QV/image.jpg (https://postimages.org/)

https://x.com/fellix_bg/status/1797661462640685129Falls das mit den getrennten L3-Bereichen sich so bestätigt, frage ich mich ob das überhaupt ein 12C-CCX ist. Dann sieht es eher wie ein 8C-Zen5c-CCX + ein 4C-Zen5-CCX aus. Ist vielleicht gut aus Stromspargründen (der L3 im Zen5c-CCX muß nicht den Kerntakt der Zen5 schaffen), aus Performancesicht wäre es andersrum aber besser.

dildo4u
2024-06-04, 13:29:17
BTW, das einzig leicht enttäuschende jetzt wo man sieht das Intel LL nur wenig später in TSMC N3B fertig ist der nach wie vor verwendete TSMC 4nm Prozess. Hier wäre 3nm offensichtlich durchaus möglich gewesen.
Intel muss sich mit den neuen Produkten guten Willen einkaufen AMD will über 50% Marge ganz einfach.

4nm TSMC reicht in dem Fall für die beste Leistung bei der CPU/NPU und Grafik.
Qualcomm hat zu wenig Grafik Power und Intel Lunar Lake zu wenig CPU Kerne.(4P + 4E)

Pirx
2024-06-04, 13:32:49
IMHO: Bezogen auf die ganzen Änderungen die AMD in ZEN5 eingebracht hat erscheinen mir +16% IPC doch arg wenig zu sein. Ich hatte, auch im Bezug auf ZEN3 schon mit >25% IPC gerechnet. IMHO enttäuschend.
Mal sehen, wie es in der Praxis aussieht. Ich könnte mir vorstellen, daß AMD eher tief gestapelt hat.

Gipsel
2024-06-04, 13:43:03
IMHO: Bezogen auf die ganzen Änderungen die AMD in ZEN5 eingebracht hat erscheinen mir +16% IPC doch arg wenig zu sein. Ich hatte, auch im Bezug auf ZEN3 schon mit >25% IPC gerechnet. IMHO enttäuschend.Naja Gesetz des sinkenden Grenzertrags. Schau dir mal an was Lion Cove in Lunar Lake alles ggü seinem Vorgänger ändert und holt damit auch nur +14% IPC heraus. :)Und diese +14% IPC von Lioncove sind explizit single-threaded. Durch das fehlende HT gibt es in MT-Szenarien mit Lioncove sogar etwas weniger Leistung pro Kern (etwa -5%, weswegen die E-Cores für MT noch wichtiger werden).

prinz_valium_2
2024-06-04, 14:29:28
https://x.com/AMDGPU_/status/1797723549840617523

Introducing the worlds most powerful mobile APU:

Ryzen AI 9 HX 370

- 50 teraOps AI NPU��
- 16CU RDNA 3.5 GPU��
- 1.5x L3 cache (24MB)��
- 12 core (24 thread)
- +30% gaming perf vs X Elite
- +30% MT perf vs X Elite

https://www.amd.com/de/products/processors/laptop/ryzen/300-series/amd-ryzen-ai-9-hx-370.html

Huang baut lieber AI only und überlässt Su den mobilen Markt komplett.

Warum auch nicht. Einen dedizierten AI Beschleuniger in einem Datacenter verkaufen bringt fast das 100 fache an Umsatz von so einem Chip an OEM Partner und beim Gewinn sollte es noch mehr sein.

Außerdem ist dort die Konkurrenz mittlerweile groß mit jetzt AMD, Intel und Qualcomm.
Dazu durfte nVidia ARM nicht kaufen.

Würde also auch nicht in den Mark gehen wollen, wenn ich nicht gezwungen bin.

maximus_hertus
2024-06-04, 15:19:43
https://x.com/AMDGPU_/status/1797723549840617523
Huang baut lieber AI only und überlässt Su den mobilen Markt komplett.

Huang baut und verkauft, AMD kündigt an, das ist ein riesengroßer Unterschied.

Ich will erstmal eine breite Verfügbarkeit und vielen AMD Notebooks sehen (real kaufbar). Vorher ist es, wie immer, nur Hype um "nichts".

davidzo
2024-06-04, 15:38:22
GPU wird man sehr unwahrscheinlich auf Radeon Niveau kommen. (Treiber und Spieleoptimierungen - wie aufwändig das ist, hat Intel die letzten 2 Jahre gezeigt)
Ja, es ist echt traurig dass es immer noch keinen LLC/MALL für die GPU gibt. Wenigstens 8 Megabyte, cmon AMD. Damit hätte AMD Entrylevel mobile GPUs wie die 2050m oder 3050MaxQ erreicht, welche die Mehrzahl der verkauften Mobilchips ausmachen.
Intel hat zwar auch geknausert bei den XE-Cores, aber immerhin hat die LNL GPU 8MB LLC bekommen.

Viel wird sich AMD trotz massivem FP32 Compute Overhead nicht distanzieren können. Das Teil ist genau wie Phoenix schon 95% Bandbreitenlimitiert. In Bezug auf AI kann sich Intel durch die Matrixeinheiten sogar vorne sehen.

Und diese +14% IPC von Lioncove sind explizit single-threaded. Durch das fehlende HT gibt es in MT-Szenarien mit Lioncove sogar etwas weniger Leistung pro Kern (etwa -5%, weswegen die E-Cores für MT noch wichtiger werden).
Naja, wenn ich mir das Performance/Power Diagramm von Intel anschaue, dann endet das auf der rechten Seite bei 10% Differenz. Die 14% sind irgendwo in der Mitte der Power/Performance Kurve. Und hier ist LNL vs MTL gestellt. Da MTL ein Defizit auf RTL hat könnte es durchaus sein dass die Differenz bei ARL vs RTL noch geringer ist im ST.

The_Invisible
2024-06-04, 16:06:22
3nm ist zu teuer, weil Huang die Kapazitäten schon vorreserviert hat. AMD muss mit dem Floorplan und 4nm besser umgehen als der verschwenderische Huang mit 3nm und seinem KI-Wahn.

Intel zerrt ja schon an Deutschen Steuergeldern um überhaupt mithalten zu können, trotz besserer Fertigung (TSMC N3B).

Ja klar nur NV ist im KI Wahn aber AMD nennt sogar ihre Produkte so :freak:

mczak
2024-06-04, 17:03:23
Ja, es ist echt traurig dass es immer noch keinen LLC/MALL für die GPU gibt. Wenigstens 8 Megabyte, cmon AMD. Damit hätte AMD Entrylevel mobile GPUs wie die 2050m oder 3050MaxQ erreicht, welche die Mehrzahl der verkauften Mobilchips ausmachen.
Theoretisch wäre es denkbar dass AMD bei Strix Point den L2 Cache der GPU vergrössert. Traditionell hatten APUs eigentlich eher grössere L2 GPU Caches im Vergleich zu Low-End GPUs weil sie eben weniger Bandbreite zur Verfügung hatten.
Rembrandt und Phoenix mit ihren 12 CUs haben 2MB L2 GPU Cache, N24 mit den 16 CUs dagegen bloss 1MB - aber natürlich hat N24 dafür 16MB IC.
Aber selbst wenn AMD den L2 GPU Cache bei Strix vergrössert (wohl eher unwahrscheinlich), mehr als 4MB werden das sicher nicht werden. 16MB LLC wären für eine GPU dieser Klasse (und mit 128bit lpddr5x) schon nicht verkehrt (dafür könnte man dann auch den L2 der GPU wieder verkleinern).

HOT
2024-06-04, 17:09:16
BTW, das einzig leicht enttäuschende jetzt wo man sieht das Intel LL nur wenig später in TSMC N3B fertig ist der nach wie vor verwendete TSMC 4nm Prozess. Hier wäre 3nm offensichtlich durchaus möglich gewesen.

Dafür kostet AMD eine CPU deutlich weniger. Das ist ein Träger mit ein oder zwei kleinen 4nm-Chips, da kann Intel kostentechnisch nicht ansatzweise mithalten. Bei Kraken Point ist das ähnlich, das ist ein 4nm-Monolith unter 180mm² mMn. Dafür, dass AMD im Grunde das gleiche erreicht, ist das wohl doch eher der bessere Ansatz.

Gipsel
2024-06-04, 17:12:45
Naja, wenn ich mir das Performance/Power Diagramm von Intel anschaue, dann endet das auf der rechten Seite bei 10% Differenz. Die 14% sind irgendwo in der Mitte der Power/Performance Kurve.Nein. Die +14% sind IPC bei ST-Last. Bei MT leistet ein LionCove weniger als ein Redwood Cove (und wohl auch Raptor Cove).
IPC != Performance/W.
Im Übrigen beinhaltet die Perf/W Vorsprung von Lioncove gegen Redwood auch den unterschiedlichen Prozeß, nicht nur das Design.

Nightspider
2024-06-04, 17:25:07
Welcher 4nm Prozess wird denn nun genutzt?

Eine neuere Variante als bei Phoenix?

Hoffen wir das AMD eine hohe Stückzahl für gute Verfügbarkeit bei TSMC geordert hat.

HOT
2024-06-04, 17:34:45
Das wird alles die gleiche Variante eines von AMD customisierten N4-Prozesses sein. Das war bei N7 ab Mitte 2020 so, bei N5 und jetzt eben bei N4. Die werden alle den selben Prozess erhalten mMn.

dildo4u
2024-06-04, 17:41:14
Wird die selbe Fertigung sein Hawkpoint maxt bei 5.2 GHz.

https://www.amd.com/de/products/processors/laptop/ryzen/8000-series/amd-ryzen-9-8945hs.html

Ryzen AI 370hx 5.1 Ghz
https://www.amd.com/de/products/processors/laptop/ryzen/300-series/amd-ryzen-ai-9-hx-370.html

robbitop
2024-06-04, 19:48:04
Ja, es ist echt traurig dass es immer noch keinen LLC/MALL für die GPU gibt. Wenigstens 8 Megabyte, cmon AMD. Damit hätte AMD Entrylevel mobile GPUs wie die 2050m oder 3050MaxQ erreicht, welche die Mehrzahl der verkauften Mobilchips ausmachen.
Intel hat zwar auch geknausert bei den XE-Cores, aber immerhin hat die LNL GPU 8MB LLC bekommen.

Viel wird sich AMD trotz massivem FP32 Compute Overhead nicht distanzieren können. Das Teil ist genau wie Phoenix schon 95% Bandbreitenlimitiert. In Bezug auf AI kann sich Intel durch die Matrixeinheiten sogar vorne sehen.

Sehe ich komplett genauso. Scheiss Geiz beim LLC. Gerade für Handhelds kann das richtig was bringen. Bessere durchschnittliche Memorylatency für die CPU (weil hitrate besser) -> weniger Takt bei gleicher Performance nötig -> Perf/W steigt.
GPU hitrate steigt -> weniger Zugriff auf den vram -> man spart Energie.
Und absolut gesehen wird die GPU schneller.

Ob die 8MB MALL von LL so wirksam für die GPU werden muss man mal sehen. Die Erklärung wirkte ja eher so als wenn es den E Cores und der npu und der media engine helfen soll. Alle zerren an den winzigen 8 mib und es könnte sein dass die gpu nicht die höchste allocation bekommt. Mal sehen.
Es ist immerhin ein Anfang. Mir würden 64 MiB als LLC für alles wesentlich besser gefallen.

davidzo
2024-06-04, 23:43:55
Ob die 8MB MALL von LL so wirksam für die GPU werden muss man mal sehen. Die Erklärung wirkte ja eher so als wenn es den E Cores und der npu und der media engine helfen soll.
Für mich sieht das so aus als wenn der GPU L2 und der memory Side Cache der Videoengine / System level cache nicht dasselbe sind.

Wenn der GPU L2 Cache geshared wäre, wieso ist er dann so prominent mit im GPU Blockschaubild aufgeführt genau an derselben Stelle wie der L2 bei bisherigen Arc GPUs?

Zurück zu strix point:
Ich würde selbst einen reinen GPU IFcache der nicht von der CPU geshared wird als sinnvoller erachten als die 4CUs die extra dazu gekommen sind.
AMD ist in die vollen gegangen bei CPUkernen, GPU CUs und der NPU aber ausgerechnet nicht beim GPU-Cache. Außerdem schleppt man im Vergleich zu Hamoa und LNL noch immer viel zu viele PCIelanes und i/o features mit sich. 4x Lanes für die SSD, mehr braucht man nicht und die Diefläche hätte man dann für einen LLC verwenden können.
Strix soll ja auch in gaming labtops und biszu 54Watt skalieren, was ich nicht ganz verstehe denn schließlich gibt es auch noch Strix Halo und Fire range für diesen Zweck.
Das wahre Gegenstück zu LNL wird wohl erst Kraken point, kommt aber gegenüber LNL verspätet.

robbitop
2024-06-05, 07:08:43
Ach du meintest die 8 MiB L2. OK. :) Ich dachte du meintest den LLC.

Zossel
2024-06-05, 07:13:50
Außerdem schleppt man im Vergleich zu Hamoa und LNL noch immer viel zu viele PCIelanes und i/o features mit sich. 4x Lanes für die SSD, mehr braucht man nicht

Warum?

robbitop
2024-06-05, 07:41:42
Im ultramobile Notebook was kaum über 1 kg wiegt? ;) Dafür ist LL gedacht. Größere Geräte Arrowlake. :)

Zossel
2024-06-05, 07:53:06
Im ultramobile Notebook was kaum über 1 kg wiegt? ;) Dafür ist LL gedacht. Größere Geräte Arrowlake. :)

Ist das die einzige mögliche Anwendung für das Ding?

robbitop
2024-06-05, 08:23:44
Ultra mobile scheint zumindest die Anwendung zu sein für die Intel es vermarktet. Unnötiges I/O kostet auch Strom - was im ultra mobile Bereich kontraproduktiv ist.

amdfanuwe
2024-06-05, 20:10:32
Wie groß ist eigentlich Strix Point?
Könnte AMD den auch noch in einem Package wie Lunar Lake mit on Package LPDDR5 bringen?

fondness
2024-06-07, 11:00:49
Im vielgeliebten Geekbench (:D) OpenCL Tests liefert die 890M immerhin 39% mehr Performance als die 780M
https://videocardz.com/newz/amd-radeon-890m-rdna3-5-graphics-are-39-faster-than-radeon-780m-in-opencl-test
https://browser.geekbench.com/v6/compute/2297238

Damit ist man sogar knapp schneller als eine 1650 Ti dGPU.

BavarianRealist
2024-06-07, 17:04:08
Interessant bei Strix wäre die Diesize. Sehe ich mir das Bild davon während der Präsentation an, in der das Strix-Die skizzenhaft mit den einzelnen Elementen darauf dargestellt ist, fallen dort die CUs der GPU auffällig klein aus. Die vier Zen5-Cores mit den 8 Zen5c-Cores dürften auch nur kaum größer als die vorherigen 8 Zen4-Cores sein, sodass am Ende womöglich das Strix-Die kaum größer als das Phoenix/Hawk-Point-Die ist.

Triskaine
2024-06-07, 17:48:37
Strix ist 225mm² groß, Phoenix 178mm². Der Prozess ist bei beiden N4, also können Density Verbesserungen nur über Designmaßnahmen erzielt werden. Die aufgeblasene NPU, die extra WGPs und die zusätzlichen Kerne gibt es nicht umsonst. Strix wird es dafür auch nicht in den günstigen Laptops geben, dafür kommt später Krackan Point, mit 8 Kernen (4xZ5+4xZ5c) und halb so großer GPU.

robbitop
2024-06-07, 18:48:29
Sicher dass es bei astrid nicht schon sowas wie N4P ist? Da gäbe es ggü N4 immerhin seichte Verbesserungen

fondness
2024-06-07, 19:13:35
Beide sind laut Angaben von AMD N4P. Also Phoenix und Strix Point.

BTW, witzig, dass genau jetzt Kraken Point in die Linux Treiber eingefügt wird:
https://videocardz.com/newz/amd-adds-gfx1152-kraken-point-apu-with-rdna3-5-graphics-to-open-source-linux-drivers

reaperrr
2024-06-07, 19:53:08
Sicher dass es bei astrid nicht schon sowas wie N4P ist? Da gäbe es ggü N4 immerhin seichte Verbesserungen
N4P hat gegenüber N4 nur elektrische Verbesserungen, die bis zu 4% mehr Packdichte für Logiktransistoren gegenüber N5 hatte auch Original-N4 schon.

Also selbst wenn Phoenix nur N4 gewesen wäre, ziemlich egal (zumal 4% mehr Logikdichte bei APUs bestenfalls ~2% bringen würde, weil der Rest eh SRAM und Interfaces ist).

fondness
2024-06-07, 21:56:51
Hohoho, 3D-Cache im Base Die incoming^^

"The X3D stuff, we have a lot to say about it. The best part about it is we're not just resting on laurels. We're improving what we can do with X3D, it's really exciting and I'm super looking forward to talking to people about that."

Woligroski couldn't go into any specifics, but he did continue talking about what AMD is doing regarding 3D V-cache. "It's not like, hey, we've also added X3D to a chip. We are working actively on really cool differentiators to make it even better. We're working on X3D, we're improving it."

- Donny Woligroski, Technischer Marketing-Manager, AMD -

https://www.pcgamer.com/hardware/processors/amd-is-working-actively-on-really-cool-differentiators-to-make-the-next-generation-of-3d-v-cache-even-better/

robbitop
2024-06-07, 23:28:50
Das statement ist aber irgendwie nichtssagend. Das kann alles und nichts heissen. Aber es bleibt spannend. :)

bbott
2024-06-08, 00:21:24
Ich schätze bzw. hoffe die Takt Regression fällt weg oder deutlich kleiner aus.

amdfanuwe
2024-06-08, 01:13:37
Vom Aufbau her gäbe es ja viele Möglichkeiten:
1) Wie bisher Cache auf dem CCD
2) Cache unter dem CCD
3) Großer Cache Chip mit 1 oder 2 CCD gestacked, könnten sich wie ein 16Core CCX verhalten
4) Cache in neuem I/O, CCDs gestacked

Mal gespannt, was AMD sich ausgedacht hat.

HOT
2024-06-08, 06:57:58
Da schätz ich eher, dass es ein neues Cache-Die gibt für Zen5 und die große Innovation bei Zen6 erfolgt.

fondness
2024-06-08, 10:26:40
Das statement ist aber irgendwie nichtssagend. Das kann alles und nichts heissen. Aber es bleibt spannend. :)

Na klar, er darf ja auch nichts sagen. Aber eine Verbesserung ist damit allemal bestätigt. Der Cache im Base-Die wäre halt naheliegend, da es erhebliche Vorteile bringen würde.

Tesseract
2024-06-08, 15:58:02
erhebliche vorteile? cache ist idealerweise so nah an den tatsächlichen cores wie möglich. hinter dem IF wäre ein rückschritt, es sei denn der wäre dafür um ein vielfaches größer was ich aber nicht glaube. ich hoffe sehr sie opfern keine CPU-power nur um die dumme iGPU schneller zu machen.

die offensichtliche änderung wäre cache unter den cores und vollflächig, d.h. weniger takteinbußen und deutlich größer.

fondness
2024-06-08, 16:54:31
Das meine ich natürlich eh

reaperrr
2024-06-08, 17:13:10
Ich schätze bzw. hoffe die Takt Regression fällt weg oder deutlich kleiner aus.
Das wär schon ne Menge wert.

9800X3D mit 9700X-Taktraten würde sich dann auch deutlicher vom 7800X3D absetzen, wenn zu den 16% mehr IPC auch noch bis zu 10% mehr Takt kommen.

OgrEGT
2024-06-09, 13:29:49
https://videocardz.com/newz/amd-teases-cool-differentiators-for-next-gen-ryzen-9000x3d-series-with-3d-v-cache
Wäre ja cool wenn es mehrere X3D Größen gäbe :) bisher gab es " nur" 64MB auf einem CCD... Ob es ggf X3Dx2 stacked auf oder unter einem CCD geben könnte?

M4xw0lf
2024-06-09, 16:00:45
XX3D, XXX3D.. :freak:

Der_Korken
2024-06-09, 16:37:42
Ich hab mich schon vor Zen 4 gefragt, ob man nicht auch eine L2-Erweiterung auf einem Cache-Die unterbringen könnte. Durch die kompaktere Form müsste die Latenz besser sein als bei einem entsprechend großen planaren L2. Es muss ja nicht gleich eine Verdreifachung sein. 2MB L2 pro Kern mit 14er Latenz wäre schon geil.

Gipsel
2024-06-09, 16:50:11
Ich hab mich schon vor Zen 4 gefragt, ob man nicht auch eine L2-Erweiterung auf einem Cache-Die unterbringen könnte. Durch die kompaktere Form müsste die Latenz besser sein als bei einem entsprechend großen planaren L2. Es muss ja nicht gleich eine Verdreifachung sein. 2MB L2 pro Kern mit 14er Latenz wäre schon geil.Es gibt da einen Crossover. Die Verbindungen zum gestackten Die sind zwar ziemlich gut, aber eine gewisse Penalty gibt es da schon. Relaativ kleine Caches würden merklich langsamer werden. Wo genau der Crossover liegt, weiß im Moment wohl nur AMD. Es hat aber schon einen Grund, warum das beim L3 eingeführt wurde, wo die Latenzerhöhung durch das Stacking geringer ausfällt, als wenn man den gesamten Cache in eine Ebene gepackt hätte.

Denniss
2024-06-09, 17:09:32
stacked L2 wird mit der Latenz nicht passen. AMD könnte aber den L2 vergrößern zu Lasten des OnDie-L3 und dafür generell mit stacked L3 in verschiedenen Größen arbeiten

robbitop
2024-06-09, 17:36:20
IMO: ist das Cachesystem bei Ryzen X3D bis dato sehr sehr gut ausbalanciert. Alle Stufen sind für ihre Größe schnell und in Summe hat man viel Cache und alle Stufen greifen gut ineinander. Ob da noch so viel Verbesserung drin ist? Mein Eindruck ist hier ist man gut aufgestellt, so dass der Cache die CPU in Spielen schön füttern kann und nicht viel gewartet werden muss. Jetzt muss es mehr oomph seitens der CPU geben. Takt oder IPC. (was mit Zen 5 ja kommt und wenn der vcache jetzt unter dem Kern sitzt ist ggf relativ zu Zen4 X3D auch mehr Takt drin - ohne Taktverlust wären es dann immerhin 5,7 statt 5 GHz. Also 14% mehr Takt und 16% mehr IPC. Wenn es gut läuft wären es dann beim X3D deshalb +30%)

bbott
2024-06-09, 18:11:55
XX3D, XXX3D.. :freak:
X3D UND X3D² ;)

The_Invisible
2024-06-09, 18:26:37
Ich schätze bzw. hoffe die Takt Regression fällt weg oder deutlich kleiner aus.

Das wär geil, würde einen guten bump geben auch für Anwendungen. Schade das man wieder warten muss...

bbott
2024-06-09, 20:43:38
(was mit Zen 5 ja kommt und wenn der vcache jetzt unter dem Kern sitzt ist ggf relativ zu Zen4 X3D auch mehr Takt drin - ohne Taktverlust wären es dann immerhin 5,7 statt 5 GHz. Also 14% mehr Takt und 16% mehr IPC. Wenn es gut läuft wären es dann beim X3D deshalb +30%)
Auch die abgesenkte TDP (niedrigere Temperaturen?) würde ich, als weiteres Indiz in diese Richtung deuten. Ob es wirklich gleich komplett aufschließt :cool: Aber selbst ~5,4 Ghz wären schon mal nicht schlecht :D

mocad_tom
2024-06-09, 22:48:55
"The X3D stuff, we have a lot to say about it. The best part about it is we're not just resting on laurels. We're improving what we can do with X3D, it's really exciting and I'm super looking forward to talking to people about that."

Woligroski couldn't go into any specifics, but he did continue talking about what AMD is doing regarding 3D V-cache. "It's not like, hey, we've also added X3D to a chip. We are working actively on really cool differentiators to make it even better. We're working on X3D, we're improving it."

- Donny Woligroski, Technischer Marketing-Manager, AMD -


Was hab ich mir vor 7 Tagen nicht alles anhören müssen.
;D ;D ;D


https://www.forum-3dcenter.org/vbulletin/showpost.php?p=13552925&postcount=2443

Ich zitiere:

"Wo hast denn den Quatsch her"

Und noch andere mehr

Ich bin doch noch nicht so schlecht beim draufschauen auf so einen Die - ich konnte da früher Stunden drübersitzen.

mocad_tom
2024-06-09, 23:04:34
Ihr habt es auch immer noch nicht mit der Taktabsenkung bei VCache verstanden?

Die Absenkung findet nicht statt, weil der Cache oben drauf ist und deshalb die Temps schlechter weggeleitet werden können(das schon, ein bisschen, aber es ist nicht das Hauptargument)


Das Hauptargument für die Taktabsenkung:
Für die Pipeline fehlen plötzlich Bubbles.
Plötzlich wird ein mittelprächtig optimierter Code zur Rakete.
Und damit dieser nicht die Pipeline abbrennt wird der Takt abgesenkt.
Da geht es dann auch drum, dass die CPU die Garantiezeit übersteht.

Gipsel
2024-06-10, 00:03:23
Was hab ich mir vor 7 Tagen nicht alles anhören müssen.
;D ;D ;D

https://www.forum-3dcenter.org/vbulletin/showpost.php?p=13552925&postcount=2443

Ich zitiere:

"Wo hast denn den Quatsch her"

Und noch andere mehr

Ich bin doch noch nicht so schlecht beim draufschauen auf so einen Die - ich konnte da früher Stunden drübersitzen.Was hat sich durch das Zitat geändert? Ein wesentlicher Teil Deiner Aussagen (das mit den Tags) ist prinzipiell unmöglich, wird also nie stimmen, egal was irgendwer sagt.
Ihr habt es auch immer noch nicht mit der Taktabsenkung bei VCache verstanden?

Die Absenkung findet nicht statt, weil der Cache oben drauf ist und deshalb die Temps schlechter weggeleitet werden können(das schon, ein bisschen, aber es ist nicht das Hauptargument)

Das Hauptargument für die Taktabsenkung:
Für die Pipeline fehlen plötzlich Bubbles.
Plötzlich wird ein mittelprächtig optimierter Code zur Rakete.
Und damit dieser nicht die Pipeline abbrennt wird der Takt abgesenkt.
Da geht es dann auch drum, dass die CPU die Garantiezeit übersteht.Dafür muß aber nicht der maximale Boosttakt abgesenkt werden (der dynamisch anliegende effektive Takt ist dann bei gegebenem Code eventuell nur geringer, um die diversen Temperatur- und Verbrauchslimits einzuhalten). Dies ist bei schlechter zu kontrollierenden Hotspots, aber auch Strom-/Spannungslimits der gestackten Verbindungen allerdings tendentiell deutlich schlechter möglich (niedrigerer Maximaltakt ist also ein probates Mittel dagegen).
Außer dem Umdrehen des Stacking (wofür man ebenfalls einige Probleme lösen muß, wie Routing aller Signale und Spannungsversorgungen durch das Base-Die) könnte da auch ein anders ausgelegtes Cache-Die helfen, was noch mehr Kontakte vorsieht.

reaperrr
2024-06-10, 00:10:22
Das Hauptargument für die Taktabsenkung:
Für die Pipeline fehlen plötzlich Bubbles.
Plötzlich wird ein mittelprächtig optimierter Code zur Rakete.
Und damit dieser nicht die Pipeline abbrennt wird der Takt abgesenkt.
Da geht es dann auch drum, dass die CPU die Garantiezeit übersteht.
Also zu viel Bandbreite bei höheren TDPs == schlecht? :freak:

Im Übrigen wird beim 9950X3D sicherlich eine Taktabsenkung ggü. dem 9950X mit seinen 170W erfolgen, aber rein von TDP/Hitze her sollte ein 9800X3D mit 9700X-Taktraten grundsätzlich möglich sein, wenn letzterer schon 40W weniger braucht als der 7700X.

Das wird dann eher aus Gründen der SKU-Segmentierung nicht erfolgen (9950X3D soll auch in Spielen schneller als 9800X3D sein, damit Enthusiasten mit genug Geld bitte die teureren Modelle kaufen).

latiose88
2024-06-10, 01:04:02
naja alleine beim Ryzen 9 9950x wird ja der Standard Takt schon mal gesenkt.Ob der Maximale Boost auf allen Kernen ebenso gesenkt sein wird oder etwas steigt,ist ne gute Frage.Auf das X3d Modell wird dies ja keine Auswirkung haben denke ich mal.

Der_Korken
2024-06-10, 01:10:52
An alle, die auf den -40W TDP rumreiten: Vergesst nicht, dass der Base Clock der Zen-5-Modelle dadurch auf das Niveau der Zen-4-nonX-Modelle gesenkt wurde. Daraus kann man erstmal nur ableiten, dass Zen 5 trotz größerem Core (und +16% IPC) pro Takt nicht mehr verbraucht als Zen 4. Ob der effektive Takt in Nicht-AVX512-Szenarien steigt, wissen wir erstmal noch nicht.

robbitop
2024-06-10, 07:48:04
Was hab ich mir vor 7 Tagen nicht alles anhören müssen.
;D ;D ;D


https://www.forum-3dcenter.org/vbulletin/showpost.php?p=13552925&postcount=2443

Ich zitiere:

"Wo hast denn den Quatsch her"

Und noch andere mehr

Ich bin doch noch nicht so schlecht beim draufschauen auf so einen Die - ich konnte da früher Stunden drübersitzen.

Worauf beziehst du dich bei dem quote? Er sagt doch inhaltlich gar nichts außer dass er ganz aufgeregt ist über Verbesserungen.

HOT
2024-06-10, 08:01:46
Was hab ich mir vor 7 Tagen nicht alles anhören müssen.
;D ;D ;D


https://www.forum-3dcenter.org/vbulletin/showpost.php?p=13552925&postcount=2443

Ich zitiere:

"Wo hast denn den Quatsch her"

Und noch andere mehr

Ich bin doch noch nicht so schlecht beim draufschauen auf so einen Die - ich konnte da früher Stunden drübersitzen.
Ähm, du hast behauptet X3D würde nicht mehr gehen. Ich hab gesagt, es wird ein neues Die geben und genau das gibt es.

OgrEGT
2024-06-10, 08:15:32
X3D wirds weiter geben die Frage war oben drauf oder drunter...

HOT
2024-06-10, 08:53:16
Bei Zen5 wirds wohl weiterhin drauf sein, weil sich ja an der Konfiguration nichts ändert, ab Zen6 werden die Karten dann komplett neu gemischt.

mocad_tom
2024-06-10, 09:52:24
Ich habe vor einer Woche gesagt, dass die Strukturen für Cache oben drauf nicht mehr zu sehen sind. Die Proportionen passten nicht und andere Anhaltspunkte (z.B. die zusätzlichen Tags für den 3DCache für MOESI sind nicht mehr auffindbar, TSV Through-Silicon-Via braucht seinen Platz ...).

Da habt ihr mich in der Luft zerrissen.
Z.B. "Wo haste denn den Quatsch her"

Ich habe aber auch gesagt, dass Cache unten drunter nach wie vor eine Option ist.

Es jetzt verdrehen zu wollen Okay - passt:

https://www.forum-3dcenter.org/vbulletin/showpost.php?p=13552823&postcount=2424
Aussage 03.06.2024 9:00Uhr :
Auf das Zen5-Die passt kein VCache oben drauf.
Wollen die dann bei Zen5 Cache unten drunter klemmen?
Es schaut so aus, dass nur der Zen5C EPYC VCache oben drauf bekommt.

The_Invisible
2024-06-10, 09:55:13
Ihr habt es auch immer noch nicht mit der Taktabsenkung bei VCache verstanden?

Die Absenkung findet nicht statt, weil der Cache oben drauf ist und deshalb die Temps schlechter weggeleitet werden können(das schon, ein bisschen, aber es ist nicht das Hauptargument)


Das Hauptargument für die Taktabsenkung:
Für die Pipeline fehlen plötzlich Bubbles.
Plötzlich wird ein mittelprächtig optimierter Code zur Rakete.
Und damit dieser nicht die Pipeline abbrennt wird der Takt abgesenkt.
Da geht es dann auch drum, dass die CPU die Garantiezeit übersteht.

Klar gibts auch ein Tempproblem, mein 7800x3d wird schon mal >85°C warm obwohl CO-25 und nur 50-60W Lastverbrauch. Ist ja aber ein allgemeines Problem mit den kleinen Chiplets, ob das jemals lösbar sein wird...

Complicated
2024-06-10, 10:51:11
(z.B. die zusätzlichen Tags für den 3DCache für MOESI sind nicht mehr auffindbar, TSV Through-Silicon-Via braucht seinen Platz ...).

Da habt ihr mich in der Luft zerrissen.
Z.B. "Wo haste denn den Quatsch her"

Dieser Satz ergibt einfach keinen Sinn. Gipsel hat das schon geschrieben. Dazu jetzt noch TSV ergibt noch weniger Sinn.

mocad_tom
2024-06-10, 10:58:13
Klar gibts auch ein Tempproblem, mein 7800x3d wird schon mal >85°C warm obwohl CO-25 und nur 50-60W Lastverbrauch. Ist ja aber ein allgemeines Problem mit den kleinen Chiplets, ob das jemals lösbar sein wird...

Das meine ich damit nicht, die Hotspots direkt auf der Pipeline werden heisser, weil die Execution Units stärker ausgelastet werden(weil viel weniger Cache miss), also kann die Pipeline viel mehr im Flow bleiben.

Das wäre so als würde man plötzlich nur noch CPU Burn laufen lassen.
Und deshalb geht man mit dem Takt runter.

Sind die Cache miss da, weil wir eine Config ohne VCache haben, dann kann auch der Takt wieder hoch.

latiose88
2024-06-10, 11:03:32
Also ist je weniger Cache miss etwas schlechtes?

HOT
2024-06-10, 11:12:01
Ich habe vor einer Woche gesagt, dass die Strukturen für Cache oben drauf nicht mehr zu sehen sind. Die Proportionen passten nicht und andere Anhaltspunkte (z.B. die zusätzlichen Tags für den 3DCache für MOESI sind nicht mehr auffindbar, TSV Through-Silicon-Via braucht seinen Platz ...).

Da habt ihr mich in der Luft zerrissen.
Z.B. "Wo haste denn den Quatsch her"

Ich habe aber auch gesagt, dass Cache unten drunter nach wie vor eine Option ist.

Es jetzt verdrehen zu wollen Okay - passt:

https://www.forum-3dcenter.org/vbulletin/showpost.php?p=13552823&postcount=2424
Aussage 03.06.2024 9:00Uhr :

Das ist schlicht Unsinn. Zeige mir den Beweis. Ich verstehe nicht, was du daraus ableiten willst, das ergibt keinen Sinn.

Gipsel
2024-06-10, 11:14:06
Ich habe vor einer Woche gesagt, dass die Strukturen für Cache oben drauf nicht mehr zu sehen sind. Die Proportionen passten nicht und andere Anhaltspunkte (z.B. die zusätzlichen Tags für den 3DCache für MOESI sind nicht mehr auffindbar, TSV Through-Silicon-Via braucht seinen Platz ...).Nochmal:
Was wir bisher haben sind Symbol-Bildchen (außer den super schlecht aufgelösten Fotos, wo AMD ein paar Dies umgedreht aufgeklebt hat). Da werden irgendwelche Muster grob auf die richtigen Proportionen verzerrt, aber Details sind absolut nicht erkennbar. So benutzt AMD schon seit Zen3 die exakt gleichen Bildeelemente für die CPU-Kerne wie jetzt für Zen5 (nur bei jeder Generation neu eingefärbt).
Zen3 APU:
https://www.golem.de/2101/153653-256559-256558_rc.jpg

Zen4 APU:
https://images.anandtech.com/doci/18718/7040-Angle-3_floorplan.jpg

Zen4/Zen4c Vorstellung:
https://images.anandtech.com/doci/18913/AMD%20DC%20AI%20Technology%20Premiere%20Keynote%20Deck%20for%20Press%20and%20Ana lysts%2019.png

Zen5-CCX:
https://static.rozetked.me/imager/full/uploads/Jx/JxWfdO9Rk5HY.webp

Der Cache ist etwas anders dargestellt, okay (aber sogar dort haben die was eingemalt, was wohl die Tags darstellen soll), aber in Anbetracht dessen, daß die Kerne selbst Null Bezug zur Realität haben (außer vielleicht der Größe des Blocks, aber sogar das ist unklar, da laut den Bildchen Zen5 und Zen5c bei Strix quasi identische Größe hätten :rolleyes:), kannst Du da solche Details wie fehlende TSV-Kontakte überhaupt nicht rauslesen.

https://pics.computerbase.de/1/1/2/6/4/4-196dce355fd6bf91/21-1080.ddc2a516.jpg
Eventuell kann man da die Vermutung anstellen, daß es 2 CCX sind (4C Zen5 + 8C Zen5c), vor allem, da die Fotos des Dies das grundsätzliche Layout mit 2 getrennten L3-Caches zu bestätigen scheinen.
Und ja, die Proportionen des Caches werden anders ausfallen. Das CCD ist bei annähernd gleicher Fläche quadratischer geworden. Das CCD ist also (in der Orientierung aus obigen Bild im Spoiler) im Vergleich zu Zen4 höher, aber schmaler. Der Cache ist minimal dichter (eventuell größere Cache-Macros, um etwas höhere Dichte rauszuquetschen), und ist ebenfalls schmaler, aber höher. Kurz: egal wie man den 3D-VCache realisieren will, man benötigt wohl ein neues V-Cache-Die und kann nicht das gleiche (wie zwischen Zen3 und Zen4) recyclen. Das ist das Maximum, was halbwegs sicher ist.

mocad_tom
2024-06-10, 12:02:00
@Complicated

Im VCache-Die stecken nur die adressierbaren SRAM Zellen.

Gegenfrage:

Du bist mit den Konzepten von Cache-Assoziativität, MOESI (Modified, Owned, Exclusive, Shared, Invalid), TLB (Translation Lookaside Buffer), ASLR (Address space layout randomization) vertraut?

Diese Mechanismen stecken im Haupt-Die.
Bei einem Ryzen 7700X stecken im Haupt-Die die Cache-Tags für insgesamt 96MB L3 Cache drin.
Es sind aber nur die Cache-Tags für 32MB aktiv. Die anderen Cache-Tags schlummern ungenutzt im Haupt-Die.

Erst wenn man dann einen 7800X3D kauft werden die restlichen/ schlummernden Cache-Tags auch benutzt.

Das holen eines Datums ist zweistufig. Zuerst frage ich die Cache Tags ab, dann wenn das passt renne ich zum SRAM und hole die betreffenden Daten ab.
Damit das Abfragen des MOESI-Tags schneller erfolgt sind diese Tags auf dem Haupt-Die.

Im Prinzip das gleich wie beim alten Sockel 7, wo die SRAM-Bausteine oben rechts auf dem Mainboard drauf sind. Die Cache-Tags sind aber der Geschwindigkeit wegen im Prozessor.
https://retronn.de/imports/hwgal/hw_mainboard_soyo_586_i430FX_async.html

HOT
2024-06-10, 12:07:36
Und wo steht, dass das bei Zen5 jetzt anders ist? In Konzeptbilderchen, die du für Dieshots hälst?

mocad_tom
2024-06-10, 12:10:47
@gipsel

https://x.com/FritzchensFritz/status/1797638258723365189

Wir haben das.

Wer durch die Menge mit einer Fackel durchgeht der wird den ein oder anderen Bart anzünden. (so oder so ähnlich)

Oben drauf kommt da nix, der Zug ist abgefahren ( meine "well educated guess" )

Klar stelle ich mich da in den Wind und kann am Ende blöd aus der Wäsche kucken wie MLID.

HOT
2024-06-10, 12:14:17
Wie kommst du darauf? Da kann man doch gar nix sehen.

mocad_tom
2024-06-10, 12:43:40
Zieh dir mal das Bild von FritzchensFritz groß.

Ich habe mit Lineal auf meinem 27" gemessen.

Beim Zen4 komme ich bei L3 auf 41mmx43mm = 1763 (breite mal höhe)
Beim Zen5 komme ich bei L3 auf 22mmx50mm = 1100

Das sind nicht irgendwelche Die größen oder so, sondern ich wollte eine ziemliche Vergrößerung, damit ich es nochmals schöner messen kann.

Von 100% bei Zen4 sind wir auf 62% bei Zen5 runter.
Und das ist mit dem Fertigungs-Prozess nicht zu erklären.

Die haben da "schlummernde Strukturen" rausgeschmissen.

Die legen vllt einen extra Die auf (jetzt wo sie solche Stückzahlen und solche Margen haben).

Gipsel
2024-06-10, 13:04:46
@Complicated
Im VCache-Die stecken nur die adressierbaren SRAM Zellen.
[..]
Bei einem Ryzen 7700X stecken im Haupt-Die die Cache-Tags für insgesamt 96MB L3 Cache drin.
Es sind aber nur die Cache-Tags für 32MB aktiv. Die anderen Cache-Tags schlummern ungenutzt im Haupt-Die.Nein. Die Tags für die zusätzlichen 64MB L3 sind da auch drin.
Aus der ISSC-Präsentation zum 3D-Cache-Die:

https://www.hardwareluxx.de/images/cdn02/uploads/2022/Feb/deft_performance_xv/isscc-2022-amd-zen3-11_1920px.png

Siehst Du die Zeile unter der mit "512 128kB data macros"?
Da steht nämlich, daß im V-Cache-Die auch noch "1088 6kB tag/LRU macros" drin stecken (1024+64, jeweils 6kB; macht ein 6Byte Eintrag pro 64Byte Cacheline).

Auf den Zen3/4 Die-Shots ist auch nicht zu sehen, daß dort Tags für die dreifache Menge an L3 verbaut wären (die Menge paßt zur 32MB L3-Größe). Die entsprechenden Tags müssen also auch auf dem Cache-Die zu finden sein (wie AMD auf der ISSC-Präsentation auch bestätigt und wie auch sichtbar!).

Edit:
Von 100% bei Zen4 sind wir auf 62% bei Zen5 runter.
Und das ist mit dem Fertigungs-Prozess nicht zu erklären.Wie erklärst Du Dir die deutlich unterschiedliche SRAM-Dichte zwischen Zen3 (7nm) bzw. Zen 4 (5nm) und dem VCache-Die (7nm), wobei die bei VCache-Die am höchsten ist? Man kann stark unterschiedliche SRAM-Dichten hinbekommen, je nach dem wie man das designt (HD-SRAM-Zellen wie im V-Cache-Die?). Meinst Du nicht, es wäre möglich, daß AMD mit HD-Zellen in 4nm eine zumindest ähnliche Dichte hinbekommt wie im 7nm V-Cache-Die? Da hatte man 36mm² für 64MB Cache inklusive zugehörige Tags und den TSV-Kontakten. Ein paar Jahre später schafft man dann vielleicht auch 32MB in ~17mm² (das ist so grob die Fläche des L3-Kästchens bei Zen5 im blurry Dieshot) in 4nm hinzubekommen, oder? ;)
Allerdings läßt insbesondere die L2/L3-Trennung noch viel Spiel für Abweichungen. Laut dem Diagramm würde der L2 von Zen5 bei gleicher Größe in 4nm fast 40% mehr Fläche einnehmen als noch in 5nm bei Zen4. Es ist also halbwegs wahrscheinlich, daß die Trennlinie zwischen L2 und L3 etwas daneben liegt (in dem Bild schaut man auf einen groben Metal-Layer, nicht auf die eigentlichen Transistorstrukturen, was das genaue Ziehen dieser Linie quasi unmöglich macht). Unter der Annahme, daß der L2 von Zen5 die gleiche Fläche einnimmt wie bei Zen4, bleiben dann schon ~18.5mm² für die 32MB L3 in N4 bei Zen5, was angesichts des VCache-Dies in N7 mit 64MB in 36mm² völlig machbar erscheint.

HPVD
2024-06-10, 13:30:43
rumor:
9000x3d bereits im September 2024
https://videocardz.com/newz/rumor-suggests-amd-ryzen-9000x3d-is-launching-sooner-than-expected

mocad_tom
2024-06-10, 13:34:09
Schau mal wie klein LRU bei diesem Bildchen ist:


https://x.com/IanCutress/status/1759709786915119194

LRU ist Least Recently Used und da wird meines wissens nur ein bisschen prefetched.

HOT
2024-06-10, 13:48:01
rumor:
9000x3d bereits im September 2024
https://videocardz.com/newz/rumor-suggests-amd-ryzen-9000x3d-is-launching-sooner-than-expected
Dass AMD die Holyday-Season nicht verpassen wird sollte klar sein. Soviel zu "X3D kommt zur CES". Das ergibt keinen Sinn. September ist ein guter Termin dafür.

Gipsel
2024-06-10, 14:00:25
Schau mal wie klein LRU bei diesem Bildchen ist:

https://x.com/IanCutress/status/1759709786915119194Und?
Ich habe doch sogar geschrieben, wie groß Tags+LRU ungefähr im Verhältnis zur Cache-Größe sind (~10% bei Zen3/4). Ändert das etwas daran, daß es im V-Cache-Die verbaut ist? Oder daß es bei jedem Cache zwingend vorhanden ist (also auch bei Zen5)?
LRU ist Least Recently Used und da wird meines wissens nur ein bisschen prefetched.Der Satz ergibt keinen Sinn.
Die LRU-Daten bestimmen (zusammen mit der Replacement-Strategie bzw. -Algorithmus), welche Cacheline aus dem Cache geschmissen wird, wenn etwas Neues geladen wird.

Der_Korken
2024-06-10, 14:04:52
rumor:
9000x3d bereits im September 2024
https://videocardz.com/newz/rumor-suggests-amd-ryzen-9000x3d-is-launching-sooner-than-expected

Wie ich schon sagte: Der 7800X3D für 325€ dominiert den DIY-Markt. Sofern die 9000er nicht unerwartet schneller sein werden in Spielen, ist dessen Markt oberhalb von 325€ quasi tot. Damit sind 9900X und 9950X größtenteils DOA, der 9700X so an der Grenze. Die 16% mehr Leistung/Kern in Anwendungen werden es nicht reißen.

Gipsel
2024-06-10, 14:11:35
Wie ich schon sagte: Der 7800X3D für 325€ dominiert den DIY-Markt. Sofern die 9000er nicht unerwartet schneller sein werden in Spielen, ist dessen Markt oberhalb von 325€ quasi tot. Damit sind 9900X und 9950X größtenteils DOA, der 9700X so an der Grenze. Die 16% mehr Leistung/Kern in Anwendungen werden es nicht reißen.Die 10% mehr Maximaltakt des 9700X im Vergleich zum 7800X3D (+12% beim 9900X und +14% beim 9950X) würde ich jetzt nicht unbedingt vergessen wollen. Insbesondere wenn man sowieso im GPU-Limit rumhängt (wie bestimmt 90% der Leute), optiert man vermutlich für die Variante, die mehr Anwendungsleistung (bei ähnlicher Spieleleistung) bietet, insbesondere wenn man nicht nur spielen sollte und Zen5 nicht zu hoch bepreist wird (bei Kauf eines neuen Systems vor etwa einem Jahr würde man den 7700X auch dem 5800X3D vorziehen; ähnliche Spieleleistung, aber der 7700X hat mehr Power in Anwendungen).
Oder man wartet noch ab, was der 9800X3D bieten wird.

robbitop
2024-06-10, 14:16:42
Der 9800X3D wird es richten.
Ich würde mir (als Gamer) nie wieder eine CPU ohne riesen LLC einbauen. In einigen Spielen bringt er nichts, weil die Hitrate "normaler" CPUs ausreichen. Bei anderen wartet die CPUs dann aber auf Daten aus dem langsamen VRAM und die X3D CPUs hingegen können so konsistent wie immer weiterarbeiten und ziehen dann ordentlich davon.

Wenn es stimmt, dass VCache ggf. dieses Mal unter dem CCD ist und man keinen Taktnachteil mehr hat, gibt es einen ordentlichen Sprung auf den 7800X3D. :)

mocad_tom
2024-06-10, 14:19:44
Nochmal:

https://www.reddit.com/r/Amd/comments/jqjg8e/quick_zen3_die_shot_annotations_die_shot_from/

Da sind Control und Victim Tagging Strukturen auf dem Haupt-Die, die nicht im VCache-Die drin stecken.

Im VCache-Die sind 64MB L3
Im Haupt-Die sind 32MB L3 (das ist heute so ausgelieferte Realität)

Wenn all das Tagging im oberen Stockwerk wäre, warum ist es dann nicht 64MB und 64MB?

Der_Korken
2024-06-10, 14:26:45
Die 10% mehr Maximaltakt des 9700X im Vergleich zum 7800X3D (+12% beim 9900X und +14% beim 9950X) würde ich jetzt nicht unbedingt vergessen wollen. Insbesondere wenn man sowieso im GPU-Limit rumhängt (wie bestimmt 90% der Leute), optiert man vermutlich für die Variante, die mehr Anwendungsleistung (bei ähnlicher Spieleleistung) bietet, insbesondere wenn man nicht nur spielen sollte und Zen5 nicht zu hoch bepreist wird (bei Kauf eines neuen Systems vor etwa einem Jahr würde man den 7700X auch dem 5800X3D vorziehen; ähnliche Spieleleistung, aber der 7700X hat mehr Power in Anwendungen).
Oder man wartet noch ab, was der 9800X3D bieten wird.

Zen 4 hat gegenüber Zen 3 >25% ST-Performance gebracht und 35-40% mehr MT-Performance pro Kern. Da sah der 7700X auch ohne 3D-Cache gut aus. Aktuell haben wir nur den 16%-Krumen, den AMD uns als Info hingeworfen hat, sowie gleiche Maximal-Taktraten. Damit sieht der 9700X gegenüber dem 7800X3D deutlich schlechter aus, als es der 7700X gegenüber dem 5800X3D tat.

Bei CB ist der 7800X3D in Spielen 18% schneller als der 7700X (trotz des geringeren Taktes, d.h. die "Spiele-IPC" dürfte knapp 30% drüber liegen), bei PCGH mit ihren selektierten Worst-Case-Szenarien sogar 28%. Der 9700X bringt jetzt nur 16% IPC (und wahrscheinlich keinen Mehrtakt, weil der 7700X bereits 5,55Ghz in der Spitze erreicht, obwohl er nur mit 5,4Ghz angegeben ist), bei denen wir nicht wissen, wie die in Spielen durchschlagen.

Es stimmt natürlich, dass die meiste Zeit im GPU-Limit gespielt wird, aber das ist kein gutes Argument für die langsamere CPU. Denn dann kann ich auch sagen, dass ein 7500F eine sogar noch bessere Wahl wäre, weil er noch weniger kostet als die 9000er und im GPU-Limit genauso schnell ist. Anwendungsperformance ist auch so eine Sache. Wer viele Kerne braucht, bekommt für knapp 500€ bereits den 7950X, der schneller als 9900X sein dürfte - und sogar billiger, wenn AMD die 7000er Launchpreise verlangt.

Gipsel
2024-06-10, 14:33:00
Nochmal:

https://www.reddit.com/r/Amd/comments/jqjg8e/quick_zen3_die_shot_annotations_die_shot_from/

Da sind Control und Victim Tagging Strukturen auf dem Haupt-Die, die nicht im VCache-Die drin stecken.Blödsinn. Natürlich gibt es auch Tags im V-Cache-Die. Sagt AMD in der entsprechenden ISSC-Präsentation von AMD (und sieht man auch auf den Bildern). Ich habe doch eine Folie davon hier gezeigt, die explizit die Tags im V-Cache-Die erwähnen!?!
Im VCache-Die sind 64MB L3
Im Haupt-Die sind 32MB L3 (das ist heute so ausgelieferte Realität)

Wenn all das Tagging im oberen Stockwerk wäre, warum ist es dann nicht 64MB und 64MB?Die Tags für die Cachelines im Haupt-Die sind im Haupt-Die und die Tags für die Cachelines im VCache-Die sind im VCache-Die. Was ist daran so schwer zu verstehen?
Und AMD hat für das VCache-Die den Cache halt ein wenig gequetscht (per HD-zellen, eventuell etwas geringere Taktanforderungen usw.), so daß sie die Dichte dort deutlich steigern konnten.
Bei Zen4 in 5nm hat man dann im unteren Die sogar ein paar Kompromisse beim Layout eingehen müssen, damit es kompatibel zum gleichen 7nm VCache-Die bleibt (hätte sonst vermutlich etwas kompakter sein können). Mit im VCache-Die erprobten Maßnahmen (für hohe Dichte und trotzdem relativ hoher Takt und akzeptable Latenz) hat man nun vermutlich bei Zen5 ein paar der Techniken zur Steigerung der L3-Dichte auch im Haupt-Die implementiert. Außerdem trägt N7=>N4 zumindest ein wenig zur höheren Cache-Dichte bei.
Wo siehst Du das Problem?

robbitop
2024-06-10, 14:46:42
Hatte Zen 4 nicht ein anderes Cache die als Zen 3? IIRC 36 mm² vs 41 mm² oder so. Aber beide in 7 nm.

ZomBy7
2024-06-10, 14:48:12
Wie ich schon sagte: Der 7800X3D für 325€ dominiert den DIY-Markt. Sofern die 9000er nicht unerwartet schneller sein werden in Spielen, ist dessen Markt oberhalb von 325€ quasi tot. Damit sind 9900X und 9950X größtenteils DOA, der 9700X so an der Grenze. Die 16% mehr Leistung/Kern in Anwendungen werden es nicht reißen.

Abwarten und Tee trinken. Man kann noch nicht einschätzen wie gut der Zen5 den niedrigeren Cache kaschieren kann. Aktuelle Intel Gens gewinnen fast nichts mit mehr Cache weil intern es besser kaschiert werden kann, dass könnte auch bei Zen5 zutreffen.

MR2
2024-06-10, 14:58:43
Man weis halt nicht was noch so geändert wurde. Vielleicht mussten sie was verbessern um sich weiter abzusetzen:

3D V-Cache: AMD arbeitet an verbesserten Next-Gen-Varianten

https://www.pcgameshardware.de/CPU-CPU-154106/News/AMD-Ryzen-mit-3D-Cache-1449148/

Gipsel
2024-06-10, 15:00:02
Hatte Zen 4 nicht ein anderes Cache die als Zen 3? IIRC 36 mm² vs 41 mm² oder so. Aber beide in 7 nm.Du hast recht. AMD hat eine neue Version produziert, die vor allem das TSV-Interface optimierte (weniger Overhead). Aber die SRAM-Arrays selber blieben wohl mehr oder weniger identisch.

amdfanuwe
2024-06-10, 15:28:23
Wie ich schon sagte: Der 7800X3D für 325€ dominiert den DIY-Markt. Sofern die 9000er nicht unerwartet schneller sein werden in Spielen, ist dessen Markt oberhalb von 325€ quasi tot. Damit sind 9900X und 9950X größtenteils DOA, der 9700X so an der Grenze. Die 16% mehr Leistung/Kern in Anwendungen werden es nicht reißen.
Unsinn. Der 7000er wird eingestellt. Mag zwar etwas dauern bis die abverkauft sind aber dann hat der Kunde keine andere Wahl als den 9000er zu kaufen.
Neue Kunden gibt es jeden Tag. Der kann erst mal entscheiden, ob er das neueste teure will oder mit der alten günstigeren Generation zufrieden ist.
Zudem stellen 9900X und 9950X kaum einen Kostenfaktor für AMD dar.

Lehdro
2024-06-10, 15:49:57
Schneller Release des X3D lässt auf eigentlich auf drei Sachen schließen:

- Zen 5 verliert in Games gegen Zen 4 X3D
- Arrowlake ist stark
- AMD ist im Zeitplan

mocad_tom
2024-06-10, 15:58:50
https://www.semianalysis.com/p/zen-4c-amds-response-to-hyperscale


Da ist ein Zen4 Durango gegen ein Zen4c Vindhya.
Beide 32MB L3 Cache.

Vindhya unterstützt keinen VCache.
Sollen wir mit dem Lineal anfangen?

Gipsel
2024-06-10, 16:05:30
https://www.semianalysis.com/p/zen-4c-amds-response-to-hyperscale

Da ist ein Zen4 Durango gegen ein Zen4c Vindhya.
Beide 32MB L3 Cache.

Vindhya unterstützt keinen VCache.
Sollen wir mit dem Lineal anfangen?Mache das bitte! Und beachte dabei bitte, daß der Maßstab der beiden Dies wohl minimal anders ist.
Die 2x 16MB sind in der Summe nur minimalst kleiner als die 32MB (ohne die TSV-Kontakte sind es wohl etwa 5%), genau wie der L2 auch minimal kleiner ist (wobei die SRAM-Zellen selber allerdings identisch sind). Dies ist vermutlich schlicht durch das auf höhere Dichte (und weniger Frequenz) optimierte Design zu erklären.

Welche Auswirkungen das auf Zen5 haben soll (wo wir keine detaillierte Dieshots haben und was ein völlig anderes Design in einem anderen Prozeß ist), darfst Du gerne erklären.

robbitop
2024-06-10, 16:20:49
Also mir ist die Diskussion nicht ganz klar. Dass es einen X3D geben wird ist klar. Das steht auch auf den geleakten Roadmaps drauf.
Entsprechend muss der X3D Cache über oder unter dem CCD sein (sonst wird es viel zu lahm). Ändert sich dadurch (ob jetzt oben oder unten) so viel am Logiklayer des L3 Cache im CCD?

Gipsel
2024-06-10, 16:37:36
Also mir ist die Diskussion nicht ganz klar. Dass es einen X3D geben wird ist klar. Das steht auch auf den geleakten Roadmaps drauf.
Entsprechend muss der X3D Cache über oder unter dem CCD sein (sonst wird es viel zu lahm). Ändert sich dadurch (ob jetzt oben oder unten) so viel am Logiklayer des L3 Cache im CCD?Nein. Wir versuchen nur zu verstehen, auf Grund welcher Informationen mocad_tom darauf besteht, daß kein VCache-Die auf das Zen5-CCD gestackt werden kann (Zen5 hätte keine Cache-Tags?!?).
Nach den bisherigen Informationen weiß man schlicht nicht, was AMD plant. Auch wenn der Cache untendrunter ist, braucht man irgendwo die Kontakte (nur daß dann die TSVs im Cache-Die sind und nicht im CCD, aber beim alten VCache-Die hat man natürlich die äquivalente Kontaktfläche wie beim CCD [die beiden vertikalen orange-rosa Streifen in dem Bild da (https://www.forum-3dcenter.org/vbulletin/showthread.php?p=13557912#post13557912)], muß ja zusammenpassen). Flächenmäßig dürfte sich das also nicht wirklich was nehmen.
Alternativ könnte AMD natürlich den Cache-Die untendrunter auch Face-to-Face zum CCD montieren (signaltechnisch eventuell am günstigsten, aber auch am schwierigsten), dann benötigt man TSVs durch den Cache-Die vermutlich nur noch zur Stromversorgung des CCDs in dem Bereich (die Signale zwischen Cache-Die und CCD gehen dagegen nicht durch TSVs). Aber Kontakte (und die dafür nötige Fläche) benötigt es natürlich dafür auch.

OgrEGT
2024-06-10, 16:47:54
Wenn der X3D$ unten ist wie bekommt man dann die viel zahlreicheren Verbindungen des CCDs durch das Cache Die zu den Kontakten unten? Vermutlich sind diese Verbindungen dann nur links und rechts vom Cache Die? Dann müssten diese aber durch das structural Silicon durch...

Gipsel
2024-06-10, 16:51:23
Wenn der X3D$ unten ist wie bekommt man dann die viel zahlreicheren Verbindungen des CCDs zu den Kontakten unten durch das Cache Die?TSVs im Bereich des Cache-Dies. Vias durch den Mold (praktisch baut man kleine ein paar zehn µm hohe Kontakt"türmchen" und vergießt hinterher) außerhalb (falls AMD einen großen CCD auf einem kleinen Cache-Die stacken will, ist nicht unmöglich aber problematisch)*. Ist eines der Probleme, die Base-Dies handhaben müssen (in dem Fall wäre der Cache-Die der Base-Die).

*Edit: Im Prinzip eine Abart von TSMCs InFO_LSI, nur eben mit nur einem Top-Die (statt als Brücke zwischen zweien).

OgrEGT
2024-06-10, 16:55:32
Hört sich irgendwie aufwändiger und damit teurer an... wenn es dadurch aber mehr Vorteile also thermisch und Leistung betreffend gibt könnte sich das lohnen...

OgrEGT
2024-06-10, 17:00:45
https://videocardz.com/newz/amd-ryzen-5-9600x-aida64-cache-test-confirms-increased-l1-l2-bandwidth
AMD Ryzen 5 9600X AIDA64 cache test confirms increased L1/L2 bandwidth
Zuwächse für sowohl L1 als auch L2 um die 80% read/write/copy
:up:

Gipsel
2024-06-10, 17:18:25
https://videocardz.com/newz/amd-ryzen-5-9600x-aida64-cache-test-confirms-increased-l1-l2-bandwidth
AMD Ryzen 5 9600X AIDA64 cache test confirms increased L1/L2 bandwidth
Zuwächse für sowohl L1 als auch L2 um die 80% read/write/copy
:up:In Anbetracht des Taktes im Test (5,05GHz vs. 5,5GHz) kommt dann am Ende pro Takt eine glatte Verdopplung der Cache-Bandbreite raus, also genau wie angekündigt.

Altehardware
2024-06-10, 17:23:08
Das klingt sehr Verdächtig nach nenn ES vom zen4 langsamere Latenz deutet auf ne geringere ipc hin was nicht sein kann
Die ipc wird durch zwei dinge Berücksichtigt cache Takt oft cpu clock und cl times.
cl1 also 0,8ns deuten auf 4,8ghz hin mit 0,8ns
10,2ns deute auf nen cl13 hin statt den cl14
Dies wäre quasi stillstand bei der ipc am ende sehr unwahrscheinlich.

Gipsel
2024-06-10, 17:33:45
Das klingt sehr Verdächtig nach nenn ES vom zen4 langsamere Latenz deutet auf ne geringere ipc hin was nicht sein kann
Die ipc wird durch zwei dinge Berücksichtigt cache Takt oft cpu clock und cl times.
cl1 also 0,8ns deuten auf 4,8ghz hin mit 0,8ns
10,2ns deute auf nen cl13 hin statt den cl14
Dies wäre quasi stillstand bei der ipc am ende sehr unwahrscheinlich.
Das ist noch kompatibel mit schlicht 10% weniger Takt (und damit 10% höhere absolute Latenzen). Einfach mit Takt skaliert (also den 7600X von 5,5 auf 5,05GHz des 9600X-Samples umgerechnet) werden aus:
7600X L1, 0,7ns => 0,76ns (Aida zeigt ja nur eine Nachkommastelle an, also 0,8)
7600X L2 2,6ns => 2,83ns
7600X L2 9,7ns => 10,56ns

Oder in Takte umgerechnet (zuerst was numerisch rauskommt, danach gerundet):
7600X L1: 3,85 (4)
7600X L2: 14,3 (14)
7600X L3: 53,35 (53???)

9600X L1: 4,04 (4)
9600X L2: 14,12 (14)
9600X L3: 50,96 (51???)

Die L3-Latenz ist bei Aida mit Vorsicht zu genießen, die Messung ist vermutlich schlicht zu ungenau. Aber am Ende bleibt, daß die Latenz (in Takten gerechnet) sich vermutlich nicht verschlechtert hat.

amdfanuwe
2024-06-10, 19:15:08
Alternativ könnte AMD natürlich den Cache-Die untendrunter auch Face-to-Face zum CCD montieren
TSVs im Bereich des Cache-Dies. Vias durch den Mold (praktisch baut man kleine ein paar zehn µm hohe Kontakt"türmchen" und vergießt hinterher) außerhalb (falls AMD einen großen CCD auf einem kleinen Cache-Die stacken will, ist nicht unmöglich aber problematisch)*. Ist eines der Probleme, die Base-Dies handhaben müssen (in dem Fall wäre der Cache-Die der Base-Die).

*Edit: Im Prinzip eine Abart von TSMCs InFO_LSI, nur eben mit nur einem Top-Die (statt als Brücke zwischen zweien).
Face to Face gefiel mir, brauchte man keine TSV. Beim bisherigen X3D wird der Cache auch vom CCD versorgt.
Dann etwas in der Art Info-PoP
88477

mocad_tom
2024-06-10, 20:18:12
Sorry musste ein bisschen suchen bin über Hans de Vrieß über Nemez zu clamchowder gekommen

https://x.com/lamchester/status/1400045287033298951

But anyway the cache die may be very light on tags. Or have none, with larger tagging granularity

OgrEGT
2024-06-10, 20:53:06
https://videocardz.com/newz/amd-ryzen-5-9600x-engineering-sample-gets-overclocked-to-5-7-ghz-across-all-cores
AMD Ryzen 5 9600X engineering sample gets overclocked to 5.7 GHz across all cores

Gipsel
2024-06-10, 21:11:11
Sorry musste ein bisschen suchen bin über Hans de Vrieß über Nemez zu clamchowder gekommen

https://x.com/lamchester/status/1400045287033298951Nochmal: Ohne Tags funktioniert ein Cache nicht. Die sind wesentlich für die Funktionsweise, weil man sonst keine Ahnung hat, (a) was in den Cachelines drin steht (Speicheradresse, also was wird da überhaupt gecached) und (b) ob das aktuell ist oder nicht (plus je nach Architektur noch ein paar andere wichtige Infos). Und wie bereits verlinkt (die ISSC-Präsentation von AMD zum VCache) lag er mit seiner damals zwischenzeitlich vermuteten Möglichkeit (vor AMDs technischen Präsentation zu dem Thema bei der ISSC), daß im VCache-Die irgendwie weniger Tags verbaut wären (weil größere Granularität oder so) schlicht daneben. Das erkannte er dann kurze Zeit später auch selbst und postete im gleichen Thread das hier (https://x.com/lamchester/status/1404134096712790016) (wo er sagt, daß die Granularität aller Wahrscheinlichkeit nach bei 64Byte bleiben wird und der VCache-Die vermutlich doch Tags enthält). Und damit hatte er am Ende völlig recht ;).
Auch mit VCache bleibt eine Cacheline bei 64Byte (das ist die Granularität der Tags) und es muß immer ein Tag pro Cacheline geben (und da muß auch im Wesentlichen das gleiche drinstehen wie in den Tags des CCD, sonst funktioniert es ja nicht).

Und irgendwie erklärst Du immer noch nicht, was die Zen2/Zen3 Tags mit Zen5 zu tun haben sollen.

Die Tags sind mit Zen4 übrigens physisch auch deutlich kleiner geworden, wie man im entsprechenden ISSC-Vortrag zu dem Thema erfahren kann (bis Zen3 hat man das quasi wie beim L2 gehandhabt). Die haben größere Macros für die Tags verbaut (mehr Storage pro Block), so daß der Overhead deutlich geringer ausfällt (die in den Tags enthaltene Menge an Bits [48Bits pro Cacheline] hat sich aber nicht verringert!).

Der_Korken
2024-06-10, 22:22:42
https://videocardz.com/newz/amd-ryzen-5-9600x-engineering-sample-gets-overclocked-to-5-7-ghz-across-all-cores
AMD Ryzen 5 9600X engineering sample gets overclocked to 5.7 GHz across all cores

1. Ohne Angaben zur Stabilität ist der hohe Takt erstmal nicht viel Wert. Der CPU-Z-Benchmark geht nur wenige Sekunden und nutzt quasi nur SSE-Instruktionen, d.h. da können auch mal super instabile Settings durchkommen.
2. Die Scores sind in Relation zum Takt komisch. 5,5% mehr Takt = 12,2% mehr ST-Punkte? Da stimmt was nicht. Entweder ist einer der beiden Scores falsch oder der Boost-Mechanismus des ES ist noch buggy und er boostet nur bis ~5,05Ghz. Der MT-Takt des ES müsste rechnerisch bei 4,95-5,0Ghz gelegen haben, wenn die 5,7Ghz OC mit den angegebenen Punkten stimmen.

Gipsel
2024-06-11, 00:21:07
2. Die Scores sind in Relation zum Takt komisch. 5,5% mehr Takt = 12,2% mehr ST-Punkte? Da stimmt was nicht. Entweder ist einer der beiden Scores falsch oder der Boost-Mechanismus des ES ist noch buggy und er boostet nur bis ~5,05Ghz.Der Artikel bezieht sich auch auf einen AIDA-Speicherbenchmark mit dem gleichen Sample (https://videocardz.com/newz/amd-ryzen-5-9600x-aida64-cache-test-confirms-increased-l1-l2-bandwidth), in dem auch der CPU-Z-Benchmark sichtbar ist. Laut dem Screenshot dort lief das Sample genau mit diesen 5,05GHz. Also kann schon sein, daß das Teil per Default nicht auf die offizielle 9600X-Frequenz boostet. Die 5,05GHz passen auch zu den Cache-Latenzen von AIDA (https://www.forum-3dcenter.org/vbulletin/showthread.php?p=13558169#post13558169).
https://cdn.videocardz.com/1/2024/06/RYZEN-9600X-L1-L2-CACHE-TEST.jpg

basix
2024-06-11, 08:23:11
Da der L1D auf 48kByte angewachsen ist: Dort also keine Latenzerhöhung? Nicht schlecht.

Edit:
Ich sehe irgendwie keine Notwendigkeit, den Cache Die unter das CCD zu stapeln. Die Taktregression kann man auch anders lösen.
Interessant wäre das darunter stapeln mMn, wenn man den ganzen L3$ auslagern würde. Sonst ist es die eher aufwändigere Lösung (z.B. grösseres Cache-Chiplet), ohne wesentliche Vorteile für das Produkt. Klar, einfachere Kühlbarkeit der Cores hätte man natürlich. Das ist für Massenprodukte aus Sicht von AMD jetzt aber nicht ein Killerkriterium, wenn man die Taktregression anders lösen würde.

Zossel
2024-06-11, 08:34:44
Da der L1D auf 48kByte angewachsen ist: Dort also keine Latenzerhöhung? Nicht schlecht.

Von 4 auf 5 Takte wäre relativ gesehen ziemlich viel. (Faktor 0,8 bzw. 1,25)

robbitop
2024-06-11, 08:42:49
Ich sehe irgendwie keine Notwendigkeit, den Cache Die unter das CCD zu stapeln. Die Taktregression kann man auch anders lösen.
Interessant wäre das darunter stapeln mMn, wenn man den ganzen L3$ auslagern würde. Sonst ist es die eher aufwändigere Lösung (z.B. grösseres Cache-Chiplet), ohne wesentliche Vorteile für das Produkt. Klar, einfachere Kühlbarkeit der Cores hätte man natürlich. Das ist für Massenprodukte aus Sicht von AMD jetzt aber nicht ein Killerkriterium, wenn man die Taktregression anders lösen würde.
Wenn man den L3 auslagern würde, würde aber einer seiner besten eigenschaften in bisherigen Zen X3Ds verloren gehen. Seine enorm niedrige Latenz für die große Größe. Sobald dieser das CCX verlässt, geht es massiv bergab mit der Latenz und damit wahrscheinlich auch mit dem Performancebenefit.
IMO ist der L3 mit X3D so wie er ist perfekt. Keine Taktregression wäre natürlich noch super - aber auch nicht kriegsentscheident.

Da der VCache aktuell über dem heißen CCD sitzt, hat das sicherlich schon einen negativen Einfluss auf den Takt. Der VCache selbst sollte thermisch deutlich freundlicher sein. Entsprechend macht es für den Takt sicherlich schon Sinn, diesen nach unten zu schieben.

Zossel
2024-06-11, 08:49:24
Wenn man den L3 auslagern würde, würde aber einer seiner besten eigenschaften in bisherigen Zen X3Ds verloren gehen. Seine enorm niedrige Latenz für die große Größe. Sobald dieser das CCX verlässt, geht es massiv bergab mit der Latenz und damit wahrscheinlich auch mit dem Performancebenefit.

Das ist in weiteren Iterationen sicherlich denkbar, also ein IO-Die mit L3 auf dem die Cores oben drauf geklebt werden.

robbitop
2024-06-11, 08:59:59
Das ist in weiteren Iterationen sicherlich denkbar, also ein IO-Die mit L3 auf dem die Cores oben drauf geklebt werden.
Ja klar - das würde ja dann grundsätzlich nichts an der X3D Konfiguration (sehr sehr starke räumliche Nähe) ändern.

Es gibt allerdings Leaks zu Zen 6, die zeigen, dass CCDs mit den IODs per Info_R verbunden werden und (für Epyc) mehrere IODs untereinander mit Info_R verbunden werden um I/O zu skalieren. Ggf. bräuchte es dann für alle Zen Produkte nur noch ein IOD. Scheint also zumindest mittelfristig kein gestapeltes IOD zu geben.

basix
2024-06-11, 09:20:02
Wenn man den L3 auslagern würde, würde aber einer seiner besten eigenschaften in bisherigen Zen X3Ds verloren gehen. Seine enorm niedrige Latenz für die große Größe. Sobald dieser das CCX verlässt, geht es massiv bergab mit der Latenz und damit wahrscheinlich auch mit dem Performancebenefit.

Ne, ne, so habe ich das nicht gemeint ;)

Oben: Cores
Mittig: V-Cache (optional)
Unten: Cache & IO

Da wird die Latenz nicht leiden. Das Base-Die und das Core-Die wären ja immer noch eine Einheit und würden zusammen das CCX bilden.

Das ist in weiteren Iterationen sicherlich denkbar, also ein IO-Die mit L3 auf dem die Cores oben drauf geklebt werden.

Exakt so :up: AMD ist laut Intel ja gut im Kleben :D

robbitop
2024-06-11, 09:20:46
Ah ok. Aber wie geschrieben. Zen 6 scheint ja IODs per Info_R anzubinden. Wenn sowas kommt, dann wird das noch etwas dauern. :)

basix
2024-06-11, 09:22:09
Anbindung ans IOD ist eine andere Geschichte. Das ist unabhängig davon, ob man das CCX nun stacked oder nicht. Wenn man das IOD näher ranbringt, kann man Bandbreite und Latenz verbessern (zum Speicher, zu anderen CCX), womit man performancetechnisch näher an ein monolithisches Design rankommt.

robbitop
2024-06-11, 09:24:03
Reden wir aneinander vorbei? Info_R ist eine 2.5D Technik. Also IOD neben CCD. Nicht vertikal. (wie ihr beschreibt: unten IOD/mitte Cache/oben CCD)

basix
2024-06-11, 09:29:55
Nein ich weiss schon was du meinst. Das IOD neben dem CCX. Das ist +/- das was man bei RDNA3 mit GCD und MCD macht. Und damit kann man die Breite des Buses zwischen CCX und IOD massiv breiter machen, ohne das der Verbrauch durch die Decke geht. CCX <-> CCX Kommunikation könnte dadurch beschleunigt werden. Oder unter Umständen auch die Speicherlatenz reduziert werden.

latiose88
2024-06-11, 10:20:35
Also heißt es je weniger Latenz desto schneller die Anwendung bei der jeweiligen Anwendung?

OgrEGT
2024-06-11, 10:32:27
Bei Speicherzugriffen wird die Geschwindigkeit durch Latenz (Verzögerung Anfrage und Ausführung) und Bandbreite (Schnelligkeit des Datentransfers) bedingt...

Zossel
2024-06-11, 11:11:31
Also heißt es je weniger Latenz desto schneller die Anwendung bei der jeweiligen Anwendung?

https://pbs.twimg.com/media/CrMQLVYXYAETGuW?format=jpg&name=4096x4096

ZomBy7
2024-06-11, 18:09:06
Is it the fastest in gaming? It's faster than the competition in our tests. X3D is still the king of the hill, but by a much smaller margin than typically between X3D and non-X3D. So a 7800X3D would, yes, be faster than 9700X, but maybe not by as much as you would expect.
- Donny Woligroski, Marketing Director bei AMD


https://www.hardwareluxx.de/index.php/news/hardware/prozessoren/63849-ryzen-9000-in-spielen-nicht-schneller-als-x3d-vorg%C3%A4nger,-aber-da-kommt-noch-was.html

KarlKastor
2024-06-11, 18:19:21
Was auch immer das bedeuten soll. Bzw sie getestet haben.
Im CB Rating ist ein 5800x3D 1% schneller als ein 7700X.
Und ein 7950X3D auch nur 3% schneller als ein 14900K.
https://www.computerbase.de/thema/cpu/rangliste/#abschnitt_empfehlungen_die_schnellsten_gamingcpus

Linmoum
2024-06-11, 18:21:17
Der Abstand zwischen Zen4X3D und Zen5 wird größer zugunsten von ersteren ausfallen, als es noch bei Zen3X3D und Zen4 der Fall war. Zen5 hat nicht mehr diesen riesigen Taktsprung, der bei der ST-Performance Zen4 noch geholfen hat.

ChaosTM
2024-06-11, 18:23:27
Was auch immer das bedeuten soll. Bzw sie getestet haben.
Im CB Rating ist ein 5800x3D 1% schneller als ein 7700X.
Und ein 7950X3D auch nur 3% schneller als ein 14900K.
https://www.computerbase.de/thema/cpu/rangliste/#abschnitt_empfehlungen_die_schnellsten_gamingcpus


das stimmt schon, aber schau dir mal den Stromverbrauch an. Speziell bei den KS Versionen.

Neurosphere
2024-06-11, 19:23:54
Man darf auch nicht vergessen das AMD Zen 5 bei der Leistungsaufnahme ziemlich eingegrenzt hat, was auch immer das am Ende bedeuten mag.

Aber bei den größeren Modellen könnte es entsprechend anders aussehen. Abwarten.

Prinzenrolle
2024-06-11, 19:34:13
~11% mehr Gaming Leistung im Schnitt langt halt einfach nicht. Am Ende sind selbst die X3D kaum schneller als die alten X3D. Freie Bahn für Intel, aber vielleicht verkacken die ja.

Was sich AMD da bei den Folien mit 14900K +~ 15% gedacht hat, weiß niemand so recht. Shit-Show. Oder hat der Praktikant X3D mit non X3D verwechselt? *Nuff said*

mboeller
2024-06-11, 19:38:40
ASUS Notebook Vergleich bei 45w

https://anandtech-data.community.forum/attachments/100/100950-65f48e865c68e0fb8aaebc962417769a.jpg

MSABK
2024-06-11, 20:14:57
Mal abwarten, das werden schon solide Chips und Zen5x3d wird dann sicher wieder Spitze. Die Basis bei Amd ist aktuell solide.

Linmoum
2024-06-11, 21:01:40
Sie kannibalisieren sich den Desktop - bzw. konkret den Gaming-Teil davon - mit den X3D halt nur selbst. Vor allem hier, da Zen4X3D und Zen5 beides AM5 sind. Bei Zen3X3D und Zen4 hatte man immerhin noch die Plattform als Unterscheidungsfaktor. Da haben Leute bei einem Neukauf dann tendenziell eher verständlicherweise direkt zu AM5 gegriffen, weil man nicht in einer Sackgasse steckte und in 7 Jahren auch noch deutlich flottere CPUs draufschnallen wird können. Und die Performance war jetzt damit im Durchschnitt auch relativ identisch. Also gab's bei Neukauf kaum einen Grund, noch Zen3 zu nehmen.

Wer zocken will, kauft einen 7800X3D und keinen Zen5. Komplett unattraktives Line-Up für diese Zielgruppe, die IMO den Großteil des DIY-Marktes in der Hinsicht ausmacht.

MSABK
2024-06-11, 21:03:03
Man muss mal schauen welche Vorzüge Zen5 gegenüber Zen4x3d bietet. Es ist ja möglich, dass Zen5 in anderen Disziplinen punktet.

Linmoum
2024-06-11, 21:05:47
Ich sehe da keine, zumal AMD ja selbst schon zugibt, dass die Performance geringer ausfallen wird. Dass man den Verbrauch der Zen4X3D unterbieten wird in Spielen, kann man ebenso im Prinzip ausschließen. Was anderes bleibt in der Hinsicht dann auch nicht mehr übrig, was irgendwie großartig relevant ist.

OgrEGT
2024-06-11, 22:03:09
Weiß nicht ob wir das Statement richtig interpretieren... da steht dass Zen4X3D (7800X3D) schneller als Zen5 (9700X) im Gaming ist aber dass der Abstand kleiner ist als angenommen wird. Wieviel der 9800X3D da drauflegen wird vor allem mit neuem X3D Cache bleibt abzuwarten... Wo da freie Fahrt bei Intel sein soll... ggf beim Stromverbrauch :ulol:

HOT
2024-06-11, 22:04:41
Die normalen CPUs sind nunmal nicht für Gaming.
Der 7800X3D wird sicherlich dier Preis/Leistungstip, während der 9800X3D der Topchip wird. Die non-X3D kann man nur noch für normale Rechner empfehlen.

iamthebear
2024-06-11, 23:07:42
Auch wenn Zen5 eine solide Architektur ist steuert AMD hier in das nächste Marketingdesaster. Ich frage mich warum die Zen5 Desktop ohne X3D überhauot noch releasen.

Wenn Zen5 wie spekuliert zum Zen4 UVP released wird bedeutet das für die Launch Reviews:
.) 9700X ist sowohl teurer als auch schlechter in Gaming als der 7800X3D
.) 9700X ist sowohk teurer als auch langsamer als der 7900X in Multimedia Applikationen
.) 9700X ist etwas besser in ST aber das wird in Reviews kaum getestet und dort kann man meistens gerade Mal zu Intel aufschließen

Bleibt eigentlich nur der 7950X übrig der noch eine Empfehlung bekommen wird.

Dass 9600X bis 9900X nun weniger TDP haben bessert die Sachen natürlich auch nicht unbedingt. Dadurch wird der MT Vorsprung zum Vorgänger noch geringer.

Der Ausblick auf den 9800X3D sieht zwar ganz giut aus aber es bleibt weiterhin ein 8 Kerner. Das sollte im Jahr 2024 nicht mehr als 300 Euro kosten.

latiose88
2024-06-12, 00:12:08
Also auf gut deutsch wer mehr Anwendungs als Zocker Typ ist für dem sind die normalen auch gedachtnund auch Empfehlenswert. Aber auch da ist ne sehr kleine Steigerung eben halt nicht der bringer. Was ich nicht verstehe ist das beim 9950x das der Grund takt gesunken sein soll aber die Watt Angabe gleich hoch geblieben ist. Ich frage mich was sich AMD dabei gedacht hatte. Das wird sich denke ich mal schon klären wenn AMD die CPUs raus bringen wird.

madzapp
2024-06-12, 03:20:38
Etwas schlechteres P/L-Verhältnis als ZEN4 ist am Anfang gar nicht schlecht glaube ich. Es kommt nicht so schnell zu einer Knappheit und die Scalper tun sich auch nicht so leicht. Muss dann eben je nach Warenbestand und Nachfrage im Preis angepasst werden.

Zossel
2024-06-12, 06:36:39
Auch wenn Zen5 eine solide Architektur ist steuert AMD hier in das nächste Marketingdesaster. Ich frage mich warum die Zen5 Desktop ohne X3D überhauot noch releasen.

So ein Scheiß aber auch das A für B besser funktioniert aber nicht für C.
So ein Scheiß aber auch das D für C besser funktioniert aber nicht für B.

Wahrscheinlich stört das aber nur die schlichten Gemüter.

dildo4u
2024-06-12, 06:45:39
Auch wenn Zen5 eine solide Architektur ist steuert AMD hier in das nächste Marketingdesaster. Ich frage mich warum die Zen5 Desktop ohne X3D überhauot noch releasen.

Wenn Zen5 wie spekuliert zum Zen4 UVP released wird bedeutet das für die Launch Reviews:
.) 9700X ist sowohl teurer als auch schlechter in Gaming als der 7800X3D
.) 9700X ist sowohk teurer als auch langsamer als der 7900X in Multimedia Applikationen
.) 9700X ist etwas besser in ST aber das wird in Reviews kaum getestet und dort kann man meistens gerade Mal zu Intel aufschließen

Bleibt eigentlich nur der 7950X übrig der noch eine Empfehlung bekommen wird.

Dass 9600X bis 9900X nun weniger TDP haben bessert die Sachen natürlich auch nicht unbedingt. Dadurch wird der MT Vorsprung zum Vorgänger noch geringer.

Der Ausblick auf den 9800X3D sieht zwar ganz giut aus aber es bleibt weiterhin ein 8 Kerner. Das sollte im Jahr 2024 nicht mehr als 300 Euro kosten.
AMD weiß das der Intel launch ein Desaster wird da sie für die High-End Chip 3nm nutzen was Zen5 billig erscheinen lässt.
Warum sollte es sie interessieren ob Zen4 besser aussieht sie machen hier wie da Kohle und Leute kaufen Boards die später Upgrades erlauben kaum einer wird von Zen 5 auf 6 gehen aber von Zen 4 auf 6.

OgrEGT
2024-06-12, 06:50:13
Dass es unterschiedliche Usecases gibt ist das eine... das andere ist dass sich die beiden Portfolios Zen4 und Zen5 leistungsmäßig überschneiden... zumindest solange beide erhältlich sind... In dieser Zeit kommt es dann auf kluge Preisbildung an um Anreize zu setzen... auch sollte man die richtigen Prozessoren miteinander für den jeweiligen Usecase vergleichen... wenn jemand >12 Zen4 Kerne für Anwendungen nutzt dann schaut er als Aufrüstoption eher nicht nach 8 sondern nach >12 Zen5 Kernen... gleiches gilt für User die bereits einen Zen4X3D Prozessor nutzen... die schauen doch auch eher nach dem nächsten Zen5X3D...

latiose88
2024-06-12, 07:23:18
@dildo4u
ja kaum einer und was sagst du zu denen die das fest so planen. Also ich gehe ja von Zen 3 auf Zen 5 direkt aber plane fest dann von Zen 5 auf Zen 6 zu wechseln sobald das geht. Wie bezeichnest du solche Menschen die fest so es auch planen und es dann auch umsetzen wollen?

Complicated
2024-06-12, 08:59:13
Ich denke AMD ist mehr daran interessiert die AM5 Plattform attraktiver zu machen für OEMs und Zen2/3 Nutzer, als den Zen4X3D zu ersetzen im Retail. Das kann auch 2 Monate später erfolgen.

Prinzenrolle
2024-06-12, 09:04:02
Weiß nicht ob wir das Statement richtig interpretieren... da steht dass Zen4X3D (7800X3D) schneller als Zen5 (9700X) im Gaming ist aber dass der Abstand kleiner ist als angenommen wird.

Das heißt kleiner als zwischen 7700X und 7800X3D. Ein Drittel etwa. Es gehen mehrere Samples herum, wenn die Zahlen so bleiben wie sie sind, wird es eine "Enttäuschung". Vielleicht kommt ja noch ein Wunder-BIOS.

Gipsel
2024-06-12, 09:57:18
Das heißt kleiner als zwischen 7700X und 7800X3D.Nein, das heißt es nicht. Der Vergleich geht ja zwischen X3D der Vorgängergeneration gegen non-X3D der aktuellen Generation.

================

Wenn man Einige hier so hört, ist es ja ganz schlimm, wenn AMD bis zum Start der 9000er-X3Ds noch den 7800X3D mit ordentlicher Gewinnmarge verkauft*. :freak:
Non-Gamer (oder wo das nicht der alleinige Fokus ist) werden ab Juli bereitwillig die normalen 9000er kaufen. Welche die X3D wollen, nehmen dann halt bis September(?) noch den 7800X3D oder kaufen dann eben 2(?) Monate später. Ich sehe irgendwo das Problem nicht.

* Spoiler-Alert: Auch die anderen 7000er-CPUs werden noch eine Weile nach Start der 9000er erhältlich sein, gegebenenfalls mit einem größeren Preisnachlaß als der 7800X3D.

Matrix316
2024-06-12, 10:13:59
Nein, das heißt es nicht. Der Vergleich geht ja zwischen X3D der Vorgängergeneration gegen non-X3D der aktuellen Generation.

================

Wenn man Einige hier so hört, ist es ja ganz schlimm, wenn AMD bis zum Start der 9000er-X3Ds noch den 7800X3D mit ordentlicher Gewinnmarge verkauft*. :freak:
Non-Gamer (oder wo das nicht der alleinige Fokus ist) werden ab Juli bereitwillig die normalen 9000er kaufen. Welche die X3D wollen, nehmen dann halt bis September(?) noch den 7800X3D oder kaufen dann eben 2(?) Monate später. Ich sehe irgendwo das Problem nicht.

* Spoiler-Alert: Auch die anderen 7000er-CPUs werden noch eine Weile nach Start der 9000er erhältlich sein, gegebenenfalls mit einem größeren Preisnachlaß als der 7800X3D.

Was ich mich frage: Wer sind denn diese Non Gamer die Ryzen CPUs ohne X3D kaufen?

Wer kauft denn noch einen normalen PC ohne damit spielen zu wollen? Die meisten schauen sich doch nach Laptops um, weil die auf der Couch einfach preiswerter sind.

Wer Videoschnitt und Fotos bearbeitet, kauft einen Mac.

Bleiben nur noch 3D Modellierer und Entwickler übrig. ;)

Lohnt sich das für AMD überhaupt Ryzens ohne 3D zu verkaufen?
:uponder:

Exxtreme
2024-06-12, 10:19:40
Lohnt sich das für AMD überhaupt Ryzens ohne 3D zu verkaufen?
:uponder:

Schau dir mal die Verkaufszahlen bei MF an:
https://www.mindfactory.de/Hardware/Prozessoren+(CPU)/AMD+Desktop.html

Die Dinger gehen auch ohne X3D sehr gut weg.

robbitop
2024-06-12, 10:21:11
Zumindest im Selbstbaubereich scheint X3D am erfolgreichsten zu sein. Zahlen von MF:
https://www.pcgameshardware.de/CPU-CPU-154106/News/Verkaufszahlen-bei-Mindfactory-1446018/

Aber ich vermute, dass der Selbstbaubereich kleiner ist als das was über OEMs verkauft wird und da könnte ich mir vorstellen, dass es anders gelagert ist.

Für mich sieht es so aus als würde X3D etwas mehr Zeit brauchen als nonX3D für Validierung etc. Warum man sich darüber jedes Mal aufregen muss, ist mir unklar. Es ist ein zusätzliches Produkt, was mittlerweile regelmäßig gerefresht wird. Entsprechend muss man als Gamer halt auf die X3D Version warten. Aber als Gamer hat man auch die letzte X3D Version genommen - entsprechend ist die Wartezeit zwischen 2x X3D Gens nicht notwendigerweise größer als zwischen zwei nicht X3D Gens.

Zumal CPUs ja auch relativ lange aktuell bleiben weil die Gen over Gen Leistungssprünge verglichen mit GPUs relativ klein sind. Selbst der 5800X3D ist immernoch super.

dargo
2024-06-12, 10:28:48
Wenn man Einige hier so hört, ist es ja ganz schlimm, wenn AMD bis zum Start der 9000er-X3Ds noch den 7800X3D mit ordentlicher Gewinnmarge verkauft*. :freak:
Non-Gamer (oder wo das nicht der alleinige Fokus ist) werden ab Juli bereitwillig die normalen 9000er kaufen. Welche die X3D wollen, nehmen dann halt bis September(?) noch den 7800X3D oder kaufen dann eben 2(?) Monate später. Ich sehe irgendwo das Problem nicht.

Ich schon... wenn es nichts zum Schwarzmalern gibt wird von einigen Usern im 3DC halt was zurecht kreiert. ;D Muss ja was ganz schlimmes sein wenn es mehr Auswahl bei Hardware für den jeweiligen Usercase gibt. :freak:


Wer kauft denn noch einen normalen PC ohne damit spielen zu wollen?
Welches Spiel läuft nicht mit einem non X3D Zen5? Fragen über Fragen. X-D

Matrix316
2024-06-12, 10:41:53
[...]


Welches Spiel läuft nicht mit einem non X3D Zen5? Fragen über Fragen. X-D

Darum geht es ja nicht. Aber welche werden mit X3D deutlich besser laufen? Ganz viele glaube ich.

Complicated
2024-06-12, 10:50:02
Manche haben noch nie von Preissegmentierung gehört. Schaut ihr euch überhaupt mal Stückzahlen im Vergleich zum Preis an? Die wenigsten kaufen sich immer die CPU mit der höchsten Performance. Analog: Ist die RX 4090 die meist verkaufte GPU?

Gipsel
2024-06-12, 10:58:24
Darum geht es ja nicht. Aber welche werden mit X3D deutlich besser laufen? Ganz viele glaube ich.Da >90% der Leute keine 4090 ihr eigen nennen dürften, sieht der "Otto-Normal-Gamer" eher so um die Null Unterschied.
Mein Bruder hat z.B. einen 7700X mit einer 4070. Das PPT des 7700X ist sogar noch runtergesetzt (auf 110W, wenn ich mich recht erinnere). Wo hätte der einen wirklichen Vorteil mit dem 7800X3D gehabt? Er hat Geld gespart (die dann in die 4070 wanderte, statt im Budget mit einer 4060Ti vorlieb nehmen zu müssen). Ihm war eine moderne Plattform wichtig (was gegen den 5800X3D sprach, der ja auch in Spielen nicht wirklich schneller als der 7700X ist und außerhalb von Spielen langsamer). Nichts spricht doch dagegen, z.B. in 2 Jahren eine neue GPU reinzustecken (und den "AI Ryzen 5 560X3D" oder wie auch immer die Zen6-Mittelklasse dann heißt). Okay, er hätte auch noch den 7600(X)er nehmen können. Aber damals kamen die ersten Berichte, daß 6Kerner in näherer Zukunft eventuell doch knapp werden könnten und viele Entscheidungen werden dann eben doch nach Gefühl mit dem Blick in die Zukunft getroffen (auch wenn davon üblicherweise abgeraten wird).

dargo
2024-06-12, 11:02:04
Darum geht es ja nicht. Aber welche werden mit X3D deutlich besser laufen? Ganz viele glaube ich.
Mein Gott bist du anstrengend!

1. Wirst du in vielen Fällen u.U. vom Zen5 X3D wenig bis gar nicht vs. non X3D profitieren. Alles wie immer abhängig von Hardware-Kombination und den eigenen Settings sowie Lastenverhältnissen der jeweiligen Games. Da empfehle ich dir den letzten Thread von Raff. Scheint für dich neu zu sein was Limits angeht.
https://www.forum-3dcenter.org/vbulletin/showthread.php?t=618668

2. Wo ist das verdammte Problem?! Wenn du meinst dir ist ein nonX3D Zen5 zu langsam fürs Gaming dann kaufst du eben Zen5 X3D wenn der soweit ist! Meine Güte...

Manche haben noch nie von Preissegmentierung gehört. Schaut ihr euch überhaupt mal Stückzahlen im Vergleich zum Preis an? Die wenigsten kaufen sich immer die CPU mit der höchsten Performance. Analog: Ist die RX 4090 die meist verkaufte GPU?
Aber wirklich, Kindergarten pur. :freak: Und logisch ist die RTX 4090 die meist verkaufte GPU... schließlich läuft kein Spiel unterhalb von diesem Segment. X-D

Daredevil
2024-06-12, 11:18:16
Effizienz ist aber imho etwas, was man beim X3D mitkauft, selbst wenn man die Leistung heute nicht abfragen kann. Wenn eine CPU im Gaming bei gleichem Takt sagen wir mal 20-30% mehr leistet, kannst du diese halt um 10-20% runter Takten und damit ggf. 30%+ Energie sparen.

Als reiner Gamer hast du imho ne tolle Auswahl zwischen 5600X3D, 5800X3D, 7800X3D und bald halt nochmal ne Schippe drauf. Alles andere ist quasi irrelevant.
Ich habe meinen 5600X mit einer 3090 gekoppelt und kam damit ziemlich gut klar, ein 5600X3D hätte ihn quasi komplett ausgelastet mit wenigen Ausnahmen. Insofern wird ein 7800X3D und mehr eh nur spannend, wenn man 4090/5090 Leistung in der Kiste hat und dementsprechend die Monitor Hardware, oder man fährt das ganze halt auf maximaler Effizienz.

Mit einem Zen5X3D und einer 5090 bekomme ich mit 200W Gesamtleistung sicherlich die Performance hin, die ich mit einem 5600X+3090 noch mit 400w+ verbüßt habe. Das ist schon sehr nett.

Nightspider
2024-06-12, 12:50:47
In welchen Anwendungen könnte doppelte Cache Bandbreite denn etwas bringen?

Games ist das wahrscheinlich ziemlich egal.

Mir war übrigens auch so das die L3 Tags nur auf dem Haupt Die war und die Cache Zellen auf dem V-Cache Slice. Kann mich aber auch irren.

vinacis_vivids
2024-06-12, 14:02:00
Hier ein Linux Review:

https://www.phoronix.com/review/amd-ryzen9-7900x3d/2

Es gibt schon ein paar Anwendungen, die davon profitieren.

latiose88
2024-06-12, 14:08:54
@matrix316 Beitrag 2669

ja stell dir vor es gibt noch die Videos umwandler so wie ich einer bin. Wo 8 Kerne zu wenig sind und 24 fast schon zu viel. Gründe gibt es ja mehr als genug aber auch Gründe die für solche spricht.

zocken macht bei mir so rund 10-20 % insgesamt aus. Aber nicht aktuell. Für mich würde sich eine x3d Modell 0 lohnen und wenn dann nur wenn ich zu faul wäre selbst die CPU zu drosseln, dann wäre das ein Argument für die x3d, das war es aber wieder, weil das Strom sparen durch drosseln.
Das kann jedoch ja jede CPU, darum lasse ich diese argument nicht gelten da es ja mit jeder CPU sowas geht.
Andere sind winrar und 7zip was aber mehr RAM Leistung als CPU Leistung kostet. Ansonsten surfe ich am PC herum. Im Grunde genommen wie die meisten anderen halt auch.
ich mache das nur für eine Anwendung extra eine neue Plattform zu holen weil ich geil auf noch mehr cpu Leistung bin wie andere geil auf immer noch mehr gpu Leistung sind.
Die jagt nach immer noch mehr cpu Leistung hat erst so richtig begonnen.
Ich scheine aber echt die nische von der nische zu sein.
Alles drüber hält mich darum nur mehr ab weil nicht nur der Preis sondern das nicht Aufrüstbar hindert mich weil jedes mal gleich einen cpu Plattform ist nicht in dem Sinn was ich mir so drunter vorstelle und so.

mczak
2024-06-12, 14:26:51
Mir war übrigens auch so das die L3 Tags nur auf dem Haupt Die war und die Cache Zellen auf dem V-Cache Slice. Kann mich aber auch irren.
Nein wie schon erwähnt wurde war das auf den Folien von AMD klar ersichtlich dass die Tags für den V-Cache auch auf dem V-Cache Die sind. Theoretisch könnte AMD das natürlich ändern, keine Ahnung ob das von der Verdrahtung her Sinn ergeben würde (im Prinzip wäre es auch möglich dass das Vorteile hat weil man allenfalls schneller weiss ob die Daten tatsächlich im L3 vorhanden sind).
Aber wie schon erwähnt wurde brauchen die 64 MB V-Cache (bei 64 Byte Cache Line Size) etwa 6 MB an Tags, das wäre zwar nicht gerade das Ende der Welt aber doch mehr ungenutztes Silizium (bei Chips ohne V-Cache) als dass man das einfach so zum Spass auf dem Haupt-Die platzieren würde.

Gipsel
2024-06-12, 14:37:58
In welchen Anwendungen könnte doppelte Cache Bandbreite denn etwas bringen?Welche mit viel AVX512. Die Anzahl der möglichen Transfers pro Takt wurde ja soweit ich weiß nicht erhöht. Sie können nur doppelt so breit sein.
Edit: Es gibt wohl doch eine AGU mehr, maximal gibt es jetzt bis zu 4 Loads/Takt oder 2 Stores/Takt (statt 3/2). Das gilt aber nur für 64bit breite Zugriffe. Die Bandbreite an sich ist dafür aber nicht das Limit. Zen4 konnte zwar drei 64bit loads/Takt durchführen, aber nur 2x 256bit (und 1x 256bit store). Letzteres wird jetzt 2x 512bit loads und 1x 512bit store pro Takt sein. Ich vermute nicht, daß die Zahl im Fall von 256bit Loads/Stores höher als bei Zen4 ist (würde etwas Performance mit AVX256 bringen, wäre aber deutlich mehr Aufwand und deswegen eher überraschend).
Zusammengefaßt dürfte die eine AGU/der eine Load-Port mehr nur recht selten deutlich was bringen und dann bleibt als Hauptprofiteur AVX512-Code. Die Transfers zwischen L1 und L2 schieben ja immer ganze Cachelines rüber. Die höhere Bandbreite dort könnte also überall was bringen, wo viele Daten aus dem L2 kommen (nicht anteilig, sondern absolut, also wo vorher L2-Bandbreite limitierte). Dies ist ein wenig mehr als nur AVX512-Code (der potentiell natürlich am meisten profitieren dürfte), aber tendentiell auch eher selten. Aber ein halber Prozentpunkt Performance irgendwo bringt eben auch in der Summe etwas.

Käsetoast
2024-06-12, 15:01:47
Wartet doch einfach mal ab wie die X3D genau aussehen. Falls die besser takten als in Relation zu den vergangenen Modellen, dann werden die sich doch ein gutes Stück mehr von den non-X3D Versionen absetzen können. Für die Zen5 X3Ds wäre das dann halt IPC Fortschritt plus Takterhöhung im Vergleich zur alten Generation und das könnte doch ein schönes Upgrade werden...

Lehdro
2024-06-12, 15:02:02
Was ich mich frage: Wer sind denn diese Non Gamer die Ryzen CPUs ohne X3D kaufen?
Jemand der halt keine 300€+ für die CPU ausgeben will? Ist doch ganz einfache Rechnung, selbst beim Gaming:

7500F ~ 160 € -> ~70% der X3D Leistung für 50% des Preises
7600 ~180 € -> extra iGPU und bissl mehr Takt
7600X ~210 € -> ~75% der X3D Leistung für 65% des Preises
7700 ~230 € -> ~ 80% der X3D Leistung für 70% des Preises
7700X ~270 € -> bissl mehr oomph beim Takt, aber irgendwie verloren bei dem Preis
7800X3D ~ 330 € -> Top Dog.
Ist ein 7800X3D 20% schneller als ein 7700X? Jo. Kostet er 20% mehr? Jo.

AMD deckt mit den non X3Ds quasi alle Preispunkte ab, wenn es um Performance auf einem zukunftsträchtigen Sockel geht. Was soll denn AMD sonst unterhalb des X3D verkaufen? Alles an Intel abgeben? :rolleyes:

Mit Zen 5 wird es in der Tat schwerer, AMD kann hier nur moderate Preissteigerungen gegenüber den bisherigen Zen 4s mitgeben - ausgehend vom derzeitigen Straßenpreis. Man muss sich einfach mal vor Augen halten dass der 7700X fast 500€ gekostet hat zum Release, das ist heute nahezu der Straßenpreis vom 7950X3D! Ein 9950X kann daher rein logisch kaum mehr als 600€ kosten, ein 9900X müsste deutlich(!) unter 500€ liegen und der 9700X darf sich bei rund 300 € rumtreiben. Der 9600X dann bei um die 250€.
Alles natürlich rein auf P/L gerechnet mit einem kleinen Tick Richtung "ist neuer, kostet also mehr" - aber viel mehr Spielraum sehe ich da nicht wenn AMD keinen Bock auf Ladenhüter und negative Reviewfazits hat.

Zossel
2024-06-12, 16:20:47
7700 ~230 € -> ~ 80% der X3D Leistung für 70% des Preises

Und dieses Teil hat eine niedrige TDP und läuft trotzdem bei Volllast um die 5Ghz auf allen Cores und wird dabei auch nicht sonderlich warm.

Sehr angenehmes Teil solange man nicht zockt.

MSABK
2024-06-12, 16:34:18
Ich könnte mir vorstellen, dass Zen4 so 15-20% im Preis fällt und Zen5 zu Beginn über 7800X3d kosten wird bis Zen5x3d kommt.

Dino-Fossil
2024-06-12, 17:25:54
Sehr angenehmes Teil solange man nicht zockt.

Und wenn man zockt wird es auf einmal schmerzhaft? :ugly:

Zossel
2024-06-12, 17:29:15
Und wenn man zockt wird es auf einmal schmerzhaft? :ugly:

Hängt vom aktuellen Ritalin-Spiegel ab.

reaperrr
2024-06-12, 17:43:04
Ich könnte mir vorstellen, dass Zen4 so 15-20% im Preis fällt und Zen5 zu Beginn über 7800X3d kosten wird bis Zen5x3d kommt.
Gut möglich.
Die Produktion hochfahren dauert ja meistens eh ne Weile, vielleicht ist AMD gar nicht so scharf drauf, Zen5 direkt aggressiv zu bepreisen, nicht nur wegen der Margen, sondern auch weil die verfügbaren Volumen zum Launch eh noch nicht so hoch sind.

Außerdem, ein "Vorteil", den AMD anders als beim Zen3->Zen4-Übergang hat:

Die Plattform ist dieselbe und es wird kaum ein AM5-Board geben, welches nicht auch ein BIOS/UEFI-Update mit Zen5-Unterstützung bekommt.

Daher kann AMD ruhigen Gewissens die Kannibalisierung durch das eigene 7K-LineUp zumindest teilweise dadurch umgehen, dass sie einfach aufhören die zu produzieren (außer vielleicht 7600 und 7500F als LowEnd unterhalb des 9K-LineUps), damit die Leute später gezwungen sind statt des 7800X3D entweder den 9700X (billiger zu produzieren) oder 9800X3D (teurer im Preis) zu nehmen.

BavarianRealist
2024-06-12, 19:29:25
Die Zen5-Chiplets dürften inzwischen vor allem auf den Server-Einsatz optimiert sein, dürfte dorthin der größte Teil gehen (bis zu 16 Chiplets auf eine Server-CPU!).

Desktop-CPUs spielen nur noch für Gamer ein Rolle, sonst fast gar nicht mehr, sodass vermutlich nur ein sehr kleiner Teil der Zen5-Chiplets noch in die Desktop-CPUs wandert.

Von daher verwundert es mich nicht, dass die Takte nicht zulegen; für die Server dürfte der Takt-Sweet-Spot eher auf 4Ghz-5Ghz gelegt sein, da hier die Effizienz weit wichtiger ist und dort bisher kaum solche Takte erreicht werden. Das betrifft auch den Einsatz von Zen5 in den Notebook-APUs.

So verwundert es kaum, dass der 9700X mit 5,5Ghz mit TDP=65Watt kommt, aber der 9950X mit nur 200Mhz mehr dann gleich TDP=170Watt hat: hier wird vermutlich einfach über die Spannung alles ausgereizt.

Wenn der 9700X mit TDP=65 Watt auskommt, dann halte ich es für möglich, dass die X3D-Varianten eventuell auch mit 5,5Ghz (oder minimal weniger) kommen könnten, womit dann ein 9800X3D gegenüber einem 7800X3D dann zusätzlich 10% mehr Takt hätte, sodass dann ein Leistungssprung beim neuen X3D von womöglich rund 25%-30% gegenüber Zen4 drin sein könnten.

Der_Korken
2024-06-12, 21:04:33
Meine Hoffnung bezüglich der Taktraten ist, dass Zen 5 für den gleichen Takt deutlich weniger Spannung braucht als Zen 4, aber dass die Boost-Taktraten nicht erhöht wurden, weil der Chip die hohen Peak-Voltages nicht mehr schafft bzw. AMD diese nicht mehr freigeben möchte. Dadurch würde die Effizienz deutlich steigen und es wird wahrscheinlicher, dass der 3D-Cache keine oder nur minimale Taktregressionen nötig hat. Was allerdings gegen die Hoffnung spricht, ist dass Strix Point auch keine Boost-Takt-Steigerung sehen wird.

Um zu untermauern, warum man auf etwas Boost-Clocks verzichten kann: https://www.techpowerup.com/review/amd-ryzen-7-7800x3d/23.html

Verbrauch im ST-Workload:

7800X3D / 5,05Ghz: 17W
7950X3D / 5,25Ghz / 1CCD: 17 W (Link (https://www.techpowerup.com/review/ryzen-7800x3d-performance-preview/20.html))
7700 / 5,35Ghz: 17W
7600X / 5,45Ghz: 21W
7700X / 5,55Ghz: 23W
7900 / 5,45Ghz / 2CCDs: 27W
7950X / 5.75Ghz / 2CCDs: 41W

Ab ca. 5,3-5,4Ghz macht Zen 4 langsam dicht und säuft wie ein Loch. Das sehe ich btw als Hauptgrund warum die 3D-Modelle in Spielen so effizient sind: Sie gehen einfach nicht in die hohen Spannungen rein. Das macht imho viel mehr aus, als dass durch den Cache irgendwelche RAM-Zugriffe gespart werden - so teuer sind letztere dann auch wieder nicht, dass man da gleich 20W+ einspart.

iamthebear
2024-06-13, 00:04:44
1.) Vergleiche wie "80% Performance für 70% des Preises" sind nur mäßig sinnvoll da immer stark individuell.

Meine Optionen sind z.B. aktuell:

a)
7800X3D: 350Euro CPU + 150 Euro Board + 120 Euro RAM = 620 Euro
100% Performance für 100% des Preises

b) 7700: 230 Euro CPU + 150 Euro Board + 120 Euro RAM = 500 Euro
80% Performance für 80% des Preises

c) Meinen 9900K behalten: 0 Euro
60% Performance für 0% des Preises


Ich versuche das Ganze eher über die Nutzungsdauer zu sehen:

Ein 9800X3D bleibt sofern die Kernanzahl nicht zum Problem wird für ca. 6-7 Jahre spieletauglich also mit Board+RAM ca. 100 Euro im Jahr.
Pro Jahr gibt es aktuell ca. 10% mehr Performance
Wenn ich also jetzt eine CPU kaufe, die 20% langsamer ist, dann hält diese 2 jahre weniger und muss mindestens 200 Euro billiger sein.

Nightspider
2024-06-13, 00:17:37
Kann AMD die Zen4D Produktion stoppen, wenn einige EPYC Prozessoren auf V-Cache setzen?

Oder wird AMD dann einfach noch ein paar Tausend auf Lager halten um Ausfälle ersetzen zu können?

reaperrr
2024-06-13, 00:39:14
Kann AMD die Zen4D Produktion stoppen, wenn einige EPYC Prozessoren auf V-Cache setzen?

Oder wird AMD dann einfach noch ein paar Tausend auf Lager halten um Ausfälle ersetzen zu können?
Auf Lager halten werden sie so oder so welche.

Ansonsten kann es auch sein, dass sie nur nach Bedarf alle paar Monate mal ein paar Tausend nachbestellen, wenn es durch Garantiefälle oder Nachfrage nach den V-Cache Epycs nötig wird.

Nur weil der 7800X3D vermutlich eher früher als später eingestellt wird, heißt das noch nicht, dass sie gleich ganz aufhören Zen4D zu produzieren.

iamthebear
2024-06-13, 08:23:02
Zen4 wird solange produziert wie noch Bedarf am Markt ist. Das sind CPUs, keine Gaming Grafikkarten. Da muss man eine bestimmte Verfügbarkeit garantieren. Da wird noch lange nichts eingestellt.

HOT
2024-06-13, 08:40:53
Nö, wenn die nur noch den Support bedienen reicht ein Lager aus.

Zossel
2024-06-13, 08:54:59
Die Zen5-Chiplets dürften inzwischen vor allem auf den Server-Einsatz optimiert sein, dürfte dorthin der größte Teil gehen (bis zu 16 Chiplets auf eine Server-CPU!).

Desktop-CPUs spielen nur noch für Gamer ein Rolle, sonst fast gar nicht mehr, sodass vermutlich nur ein sehr kleiner Teil der Zen5-Chiplets noch in die Desktop-CPUs wandert.


Irgendwie sind das ja jetzt auch offiziell Server-CPUs:

https://www.heise.de/news/Epyc-4004-ab-149-US-Dollar-AMD-Ryzen-Prozessoren-mit-ECC-RAM-fuer-kleine-Server-9725458.html

8 Stück davon in 3U:

https://www.supermicro.com/en/products/system/microcloud/3u/as-3015mr-h8tnr

][immy
2024-06-13, 11:19:05
Zen4 wird solange produziert wie noch Bedarf am Markt ist. Das sind CPUs, keine Gaming Grafikkarten. Da muss man eine bestimmte Verfügbarkeit garantieren. Da wird noch lange nichts eingestellt.
Zen4 Produktion kann theoretisch mit zen5 eingestellt werden. Auch wenn es nicht der große Wurf wird, ist die Plattform die gleiche.
Beim zen4x3d dieses allerdings etwas anders aus, da die Erwartungen hier wohl wahren, das dieser je nach Anwendungsfall noch schneller sein sollte.

Schade das man nicht direkt mit zen5x3d um die Ecke kommt. Kann aber auch einfach sein, das der Cache dort einfach nicht mehr so viel bringt. Werden wir erst erfahren wenn AMD es raus bringt oder eben nicht.

HOT
2024-06-13, 11:21:04
Wird natürlich nicht passieren, die Umstellung wird dauern. Vermutlich bleibt Zen4 noch bis weit in 25 hinein am Markt.

Zossel
2024-06-13, 11:31:12
[immy;13559940']
Schade das man nicht direkt mit zen5x3d um die Ecke kommt. Kann aber auch einfach sein, das der Cache dort einfach nicht mehr so viel bringt. Werden wir erst erfahren wenn AMD es raus bringt oder eben nicht.

Wie kommst du darauf das es keinen Zen5 mit extra Cache geben wird?
Warum sollte AMD fertige Produkte zurückhalten um damit kein Geld einzunehmen?

Lehdro
2024-06-13, 13:58:30
1.) Vergleiche wie "80% Performance für 70% des Preises" sind nur mäßig sinnvoll da immer stark individuell.

Meine Optionen sind z.B. aktuell:

Und da ist dein Fehler. Deine Optionen sind zuallererst: Aufrüsten oder nicht. Wenn du dich dann fürs Aufrüsten entschieden hast, triffst du die Wahl zwischen den genannten Punkten. Vorher schaust du nur auf welche groben Performancelevel (+25%, +50% oder mehr?) du spekulierst, damit sich das leistungstechnisch überhaupt lohnt um deine grundsätzliche Aufrüstentscheidung zu begründen.

Wenn du allerdings so argumentierst, wie du es gerade getan hast, brauchst du eigentlich nicht aufrüsten. Du fragst dich ja nicht einmal ob du mehr CPU Leistung brauchst, sondern nur wie viel dich das kosten würde. Das ist der zweite Schritt vor dem Ersten. Wenn dich jetzt nichts grundlegend stört, und das scheint es nicht, weil du ein "weiter so" mit dem 9900K als valide ansiehst, dann herrscht auch kein Aufrüstdruck. Deine Rechnung über die Nutzungsdauer hat auch nichts mit dem Kaufzeitpunkt zu tun, weil diese im Grunde immer gleich bleiben wird. Du kannst dieselbe "Diskussion" mit dir auch bei Zen 6 führen - immer noch ausgehend vom 9900K. Auch die Leistungsunterschiede zwischen den CPUs werden immer ähnlich sein, analog dazu die Preise. Und die CPU Nutzbarkeit auf 6-7 Jahre zu extrapolieren ist ziemlich mutig, stell dir mal vor du hättest dich 2016/17 für eine CPU entscheiden wollen: Das wäre aber mal so richtig in die Hose gegangen. Laut deiner Rechnung hätte es ein i5 werden müssen (https://www.computerbase.de/2017-01/intel-kaby-lake-test-core-i7-7700k-i5-7600k/3/), viel Spaß damit dann nur wenige Jahre später. Aus 5% Rückstand wurden nur 3 Jahre später teilweise 40-50%. (https://www.computerbase.de/2020-11/amd-ryzen-5000-test/4/#abschnitt_amd_ryzen_vs_intel_core_in_720p) Zumal du damals von weniger als 10% Leistungssteigerung pro Jahr ausgegangen wärst - was das ganze in deiner Berechnung noch mehr hätte kippen lassen.

dargo
2024-06-13, 14:09:40
[immy;13559940']
Schade das man nicht direkt mit zen5x3d um die Ecke kommt. Kann aber auch einfach sein, das der Cache dort einfach nicht mehr so viel bringt. Werden wir erst erfahren wenn AMD es raus bringt oder eben nicht.
Hä? Der Zen5 X3D soll September kommen, nur zwei Monate später.

][immy
2024-06-13, 15:44:51
Hä? Der Zen5 X3D soll September kommen, nur zwei Monate später.

Wurde das schon offiziell bestätigt? Bislang lese ich nur was von Gerüchten

dildo4u
2024-06-13, 15:48:20
Nein was sein könnte das 16 und 12 Core zu erst kommen.
Der 8 Cores dann gegen Intel im November.

Bei Zen 4X3D gab es eine Staffelung.

dildo4u
2024-06-13, 18:47:36
Intel zeigt AMD Server Benchmarks mit Optimierung.

https://www.computerbase.de/2024-06/reaktion-auf-amd-vorstellung-intel-korrigiert-amds-turin-vs-emerald-rapids-benchmarks

iamthebear
2024-06-14, 15:08:08
[immy;13559940']Zen4 Produktion kann theoretisch mit zen5 eingestellt werden. Auch wenn es nicht der große Wurf wird, ist die Plattform die gleiche.
Beim zen4x3d dieses allerdings etwas anders aus, da die Erwartungen hier wohl wahren, das dieser je nach Anwendungsfall noch schneller sein sollte.

AMD bedient im Desktop zwar großteils den DIY Markt aber eben nicht ausschließlich.
Für OEMs muss man je nach Zielmarkt eine (sehr) deutlich längere Verfügbarkeit anbieten, da diese bestehende Modelle nachbestellen wollen bzw. auch entsprechende Ersatzteilverfügbarkeit erwarten. Wenn ein OEM 3 Jahre Garantie anbietet dann braucht er die CPUs auch die nächsten 3 Jahre lieferbar.

Normalerweise sieht der Ablauf im Heimuserbereich eher so aus:
Herbst 2024: Launch der neuen CPUs
Mitte/Herbst 2025: Bis dahin gibt es für einen Großteil der Geräte schon ein Nachfolgermodell, das erst Mal parallel verkauft wird
2026: Geräte mit der alten CPU Generation laufen aus
2029: Ende der Garantielaufzeit => ab jetzt kann AMD die Produktion einstellen und alle Lagerbestände abverkauft haben

Bei anderen Branchen dauert das noch deutlich länger.

Schade das man nicht direkt mit zen5x3d um die Ecke kommt. Kann aber auch einfach sein, das der Cache dort einfach nicht mehr so viel bringt. Werden wir erst erfahren wenn AMD es raus bringt oder eben nicht.

VCache ist eben etwas komplexer. Aber ich frage mich warum man diesen nicht zumindest mitankündigt. Dann braucht man keine peinlichen Slides produzieren wie "der 9950X ist 20% schneller als die Konkurrenz aber langsamer als ein 7800X3D"

Nein was sein könnte das 16 und 12 Core zu erst kommen.
Der 8 Cores dann gegen Intel im November.

Bei Zen 4X3D gab es eine Staffelung.

Ist die Frage wie AMD das mit dem VCache diesmal gelöst hat. Wenn der 12 Kerner wieder aus 2x6 Kernen besteht mit nur einem VCache CCD dann kann man sich den 9900X3D echt sparen.
16 Kerner machen nur Sinn wenn diesmal beide CCDs VCache bekommen.

dargo
2024-06-14, 15:14:17
16 Kerner machen nur Sinn wenn diesmal beide CCDs VCache bekommen.
Das... aber auch vor allem müssen Games her die mit 32 Threads was anfangen können, außerhalb der Kompilierung von Shadern! Davon sehe ich noch lange nichts. Und nein... irgendwelche Kirschen mit +5-10% zählen da für mich nicht.

Der_Korken
2024-06-14, 15:28:25
Wenn der 12 Kerner wieder aus 2x6 Kernen besteht mit nur einem VCache CCD dann kann man sich den 9900X3D echt sparen.
16 Kerner machen nur Sinn wenn diesmal beide CCDs VCache bekommen.

Die erste Aussage sehe ich genauso, die zweite nicht unbedingt. Wenn das 3D-Cache-CCD mit vollem Coretakt laufen kann, könnte man auch dessen acht Kerne auch als "big cores" und die anderen acht Kerne als "little cores" flaggen und immer erstere priorisieren. Das wäre deutlich einfacher als das die Situation bei Zen 4 X3D, weil es dort quasi zwei "medium cores" mit unterschiedlichen Stärken gibt (Cache vs Takt). Im Grunde gab es bereits bei Zen 2 und 3 einen stärkeren CCD, weil einer von beiden immer deutlich besser gebinnt war als der andere. Da musste der Scheduler bereits sicherstellen, dass der kritische Thread nicht auf dem lahmen CCD lief.

Bezüglich des 9900X3D: Eventuell wäre es besser nur ein X3D-Modell mit 2CCDs zu bringen, welches 8+6 Kerne hab. Das wäre quasi ein 9800X3D mit einem "Co-Prozessor" für MT-Lasten, bestehend aus 6 "kleinen" Kernen (klein = ohne 3D-Cache und eventuell nicht so gut gebinnt). Voraussetzung wäre natürlich, dass Zen 5 asymmetrische CCD-Configs unterstützt.

iamthebear
2024-06-14, 15:31:29
Spiele nutzen derzeit 8 Kerne + SMT. So schnell wird sich in 1-2 Jahren daran nichts ändern.
Aber in 5 Jahren sieht das dann vermutlich anders aus.

dargo
2024-06-15, 17:04:26
Schwer zu orakeln. Wird hauptsächlich davon abhängen was eine PS6 und nächste XBox spendiert bekommen.

basix
2024-06-15, 19:02:19
Ich tippe bei den nächsten Konsolen auf sowas wie bei Pheonix 2 / Strix Point: 4 grosse Kerne mit mehr Takt, 8-12 "c"-Kerne

Tesseract
2024-06-15, 20:19:15
eher werden es ausschlieslich kompakte cores die dann noch weiter platzoptimiert werden wie zen 2 in current gen auch schon. so lange die in einem kontrollieren konsolenumfeld halbwegs in die nähe der großen kommen wird man den die-space lieber in was marketingwirksameres wie AI pulvern.

Nightspider
2024-06-15, 20:21:23
Rein vom Platzverbrauch gesehen lohnen sich nicht mal 4 große Kerne.

Außer man verlagert den L3 Cache und Infinity Cache komplett aus.

Aber ob in 3 Jahren die Packaging Kapazitäten groß und günstig genug sein werden für eine PS6 ist mehr als fraglich. Das hängt bestimmt am meisten davon ab ob in 3 Jahren immernoch AI Beschleuniger den Verkäufern aus den Händen gerissen werden.

Die PS5 ist aber auch noch mit sehr wenig Cache ausgekommen.

Vielleicht wird bei der PS6 auch einfach eine große APU per Elevated Fanout Bridge (wie die MCDs bei N31) mit HBM4 Cubes verbunden oder etwas in der Richtung.

Zen6 dürfte aufschlussreich werden was bei der PS6 zu erwarten sein wird.

basix
2024-06-15, 22:10:42
eher werden es ausschlieslich kompakte cores die dann noch weiter platzoptimiert werden wie zen 2 in current gen auch schon. so lange die in einem kontrollieren konsolenumfeld halbwegs in die nähe der großen kommen wird man den die-space lieber in was marketingwirksameres wie AI pulvern.

Naja, für vermutlich weniger als +5mm2 bekommt man z.B. +25% CPU Leistung für die kritischen Threads. Grosse Kerne evtl. 5.0 GHz und die kleinen 4.0 GHz. Macht schon gut was aus und die Mehrkosten sind relativ gering. Dass man den Kern generell nochmals zurückstutzt (z.B. FPU wie bei PS5) kann man immer noch machen.

ChaosTM
2024-06-15, 22:19:52
Waren die ganz kleinen Prozesse (3nm) schon immer für eher kleineren Prozessoren gedacht.

Und die Dicken kamen später? Ein NV AI Accelerator/Video Card ist um Längen komplexer..

iamthebear
2024-06-15, 22:54:09
Wenn das 3D-Cache-CCD mit vollem Coretakt laufen kann, könnte man auch dessen acht Kerne auch als "big cores" und die anderen acht Kerne als "little cores" flaggen und immer erstere priorisieren. Das wäre deutlich einfacher als das die Situation bei Zen 4 X3D, weil es dort quasi zwei "medium cores" mit unterschiedlichen Stärken gibt (Cache vs Takt).

Das Problem an dem Ganzen:
Wenn ein Gaming Thread auf dem non VCache CCD läuft so ist er nicht nur langsamer sondern braucht durch die häufigeren L3 Misses auch viel mehr Speicherzugriffe was dann alle Threads mit runter zieht also auch den Main Thread auf dem VCache CCD.
Deshalb wird zuerst jeder VCache Kern mit 2 Threads vollgeladen bevor das 2. CCD genutzt wird.

Bezüglich des 9900X3D: Eventuell wäre es besser nur ein X3D-Modell mit 2CCDs zu bringen, welches 8+6 Kerne hab. Das wäre quasi ein 9800X3D mit einem "Co-Prozessor" für MT-Lasten, bestehend aus 6 "kleinen" Kernen (klein = ohne 3D-Cache und eventuell nicht so gut gebinnt). Voraussetzung wäre natürlich, dass Zen 5 asymmetrische CCD-Configs unterstützt.

Dazu bräuchte AMD eine Art Thread Director, der dem Betriebssystem sagt welche Threads rüber geschoben werden und zwar nicht nur nach Priorität sondern danach wie viele Cache Misses dieser am non VCache CCD verursacht.

Im Hintergrund ein paar Shader zu kompilieren könnte man z.B. auch gut auf den non VCache Kernen machen können. Das sollte in den L3 passen.

Oder AMD ist nicht so heizig und spendiert gleich jedem 9950X3D einfach 2 VCache Dies. Das kostet 5$ plus Packaging und das Problem ist endgültig gelöst.

Waren die ganz kleinen Prozesse (3nm) schon immer für eher kleineren Prozessoren gedacht.

Und die Dicken kamen später? Ein NV AI Accelerator/Video Card ist um Längen komplexer..

In der Vergangenheit hatten die neueren Nodes oft mit Yield Problemen zu kämpfen wodurch die Ausbeute bei großen Chips anfangs zu schlecht war. Das ist aber aktuell bei TSMC nicht wirklich ein Thema.

Was eher das Problem ist: Komplexere Chips zu entwerfen (unabhängig von der Größe) dauert Zeit und die Validierung bei CPUs dauert auch eher lange.
Zum Zeitpunkt des Design Starts muss es jedoch schon finale PDKs des Nodes geben damit die Designer wissen was funktioniert und was nicht. Apple hat da sher früh Zugriff darauf da sie den Node mitgestalten. Der Rest muss auf das Ergebnis warten und im Fall von Zen5 war der 3nm Prozess wohl einfach noch nicht fertig bzw. Intel setzt deshalb auch nur auf N3B statt N3E.

Die ganzen AI Designs sind zwar groß, haben jedoch sehr viele sich wiederholende Strukturen und die Anzahl der verwendeten Software ist begrenzt. Das ist mit Sicherheit deutlich weniger komplex und somit schneloer designed als ein CPU Kern.

Nightspider
2024-06-16, 01:30:06
Könnte man nicht einen langgezogenen Cache Slice theoretisch nicht gleichzeitig auch als eine draufgesetzte Art der Elevated Fanout Bridge nutzen um 2 CCDs miteinander zu verbinden?

https://s20.directupload.net/images/240616/cfdrgdmr.jpg

-> kurze Latenzen und hohe Bandbreite zwischen den CCDs
-> Zugriff aller Kerne auf den L3

iamthebear
2024-06-16, 01:52:47
Oder man baut gleich ein 16 Kern CCD für den Desktop und spart sich die Arbeit. Im Datacenterbereich würde das sicher auch nicht schaden.

reaperrr
2024-06-16, 08:00:33
Oder man baut gleich ein 16 Kern CCD für den Desktop und spart sich die Arbeit. Im Datacenterbereich würde das sicher auch nicht schaden.
Oder man baut den 8C-CCD vielleicht so, dass man zwei davon zu einem logischen CCD verbinden kann, der dann - auch hinsichtlich Latenzen, L3 usw. - wie ein monolithischer CCD funktioniert. Ganz unmöglich wär's nicht.

Wenn die Yield-Rate nicht das große Problem ist, wäre ein monolithischer 16C-CCD aber vermutlich die einfachste Variante, stimmt schon.

Allein schon aus Marketing-Gründen müssen die Desktop-Kernzahlen mit Zen6 eh langsam mal wieder steigen, wenn man nicht irgendwann mit 16 Kernen gegen 40 Intel-Kerne dastehen will, die womöglich durch RentableUnits auch noch für die ersten 20 Threads ne höhere pro-Kern-Leistung anbieten.

Oranje7
2024-06-16, 08:14:37
Im normalen AM Sockelbereich halte ich 16c32t weiterhin und auch die nächsten Jahre für mehr als ausreichend.
Intel wird jetzt SMT streichen und es mit kleinen Kernen erschlagen.

Natürlich könnte auch AMD ein "big" CCD und ein "dense" CCD auf ein package bringen um die Kernzahl zu erhöhen.

robbitop
2024-06-16, 10:02:45
Zu Zen6 sollen ja größere CCDs kommen (mehr Kerne) laut Gerüchten.

HOT
2024-06-16, 10:45:54
Jo bisher war von 8, 16 und 32 Kern CCDs die Rede.
Vermutlich werden sie auch nur ein CCX jeweils sein und ich würde auf immer die Hälfte c-Kerne tippen.

iamthebear
2024-06-16, 15:51:09
Im normalen AM Sockelbereich halte ich 16c32t weiterhin und auch die nächsten Jahre für mehr als ausreichend.
Intel wird jetzt SMT streichen und es mit kleinen Kernen erschlagen.

Natürlich könnte auch AMD ein "big" CCD und ein "dense" CCD auf ein package bringen um die Kernzahl zu erhöhen.

Also ich stelle mir das so vor:
32 c Kerne für Datacenter
16 reguläre Kerne (Datacenter + Midrange/Highend Desktop)
8 reguläre Kerne (Low end Desktop)

Lehdro
2024-06-19, 13:37:42
Zen 5 Reviews am 19.07.2024?

Von Igorslab: (https://www.igorslab.de/community/threads/intel-%C3%A4u%C3%9Fert-sich-intern-zum-13th-and-14th-generation-k-sku-processor-instability-issue.9954/#post-272447)
Der 19.07.24 ist übrigens ein interessanter Stichtag, aber das weiß Lisa sicher besser. :D

Ich befürchte nämlich, dass die meisten Benchmarks der Intel-CPUs für den Ryzen Launch so noch mit dem alten Microcode gemacht werden dürften, obwohl der Fehler schon jetzt einfach behoben werden könnte. Aber es wird ein ganz klein wenig Leistung kosten. böse denkende Schelme und so... Ich hatte mir zwar vorgenommen, weniger Zeug zu leaken, aber hier ist es am Ende einfach eine Frage des Charakters. Ich fühle mich durch sowas einfach stark getriggert.

HOT
2024-06-19, 13:42:15
Also ich stelle mir das so vor:
32 c Kerne für Datacenter
16 reguläre Kerne (Datacenter + Midrange/Highend Desktop)
8 reguläre Kerne (Low end Desktop)

Sicherlich nicht. Der 8-Kern wird sehr sicher 4+4, denn für Low-Cost-CPUs reicht das problemlos. Der Mittlere wird mMn auch 8+8, weil das die optimale Konfiguration für High-End-Desktop ist. Nur beim 32 Kernen stellt sich die Frage ob man nur c macht oder auch 16+16.

basix
2024-06-19, 14:38:58
Ich glaube nicht, dass man heterogene CCD macht. Das schränkt deren Einsatzzweck ein. Es wäre sinnvoller, die kleinen Kerne aufs IOD zu packen (z.B. 4 Stück) und dann ein 8C CCD dranzuflanschen. Oder bei den schnellsten Modellen ein 16C CCD. Für Server verwendet man dann typ. das 16C und 32C CCD.

Die 4 kleinen Kerne auf dem IOD sind dort sinnvoller aufgehoben für Low Power / Background Tasks. Dann legt man das CCD nämlich faktisch schlafen. Das kann man bei Mobile wie auch Desktop machen, wenn man will. Wobei es bei Desktop weniger wichtig ist.

CrazyIvan
2024-06-20, 17:11:51
Gerüchtehalber soll doch ab Zen6 sinngemäß das Desktop-Portfolio ausschließlich mit Mobile-SKUs bedient werden.
Sprich: Die Server-CCD werden entweder nur noch dort oder bestenfalls bei Threadripper verwendet und im Desktop wird es Modelle analog Strix Halo sowie Monolithen geben. Kann mir vorstellen, dass neben dem Halo-IOD mit großer iGPU noch eine Variante mit kleiner iGPU, jedoch mehr IO aufgelegt wird.

Nightspider
2024-06-20, 17:27:45
Nur weil die gleiche Technik wie bei Strix Halo verwendet werden könnte, sind es nicht gleich Mobile-SKUs.

Wenn es mit Hilfe von Advanced Packaging keine Nachteile mehr durch Chiplets gibt, kann eben die gleiche Technik für Desktop und Mobile herhalten.

Triskaine
2024-06-21, 23:17:05
David Huang (https://x.com/hjc4869) der in den vergangen Jahren einige Architekturanalysen von Prozessoren durchgeführt und publiziert hat (z.B. letztens Zen4c) hatte die Gelegenheit auf einem Engineering Laptop mit Ryzen AI 9 365 SoC sich die Architektur von Zen5/5c mit ein paar Mikrobenchmarks und regulären Benchmarks anzuschauen: Original Link (https://t.co/5M3KadfzGe) Translated (https://blog-hjc-im.translate.goog/zen5-preliminary-review.html?_x_tr_sl=auto&_x_tr_tl=en&_x_tr_hl=en&_x_tr_pto=wapp)

Kurz Umrissen, Zen5 ist eine "SMT-Maschine", der volle architektonisch mögliche Durchsatz wird nur mit zwei Threads pro Core erreicht (Die Rückkehr der Rache des Bulldozers - Teil 2 :biggrin:). Um das (auch flächenmäßig) zu ermöglichen wurden sogar manche Strukturen (wie der uOp Cache) gegenüber Zen4 verkleinert bzw. Instruktion Latenzen erhöht. Die Single-Thread IPC Verbesserung liegt in den Geekbenchen 5&6 recht genau bei den von AMD angekündigten ~16%, bei SPECINT ist es weniger und es gibt sogar bei ein paar Subtests teilweise deutliche Regressionen pro Takt gegenüber Zen4.

Die Mobile Version der Kerne hat abgespeckten FP/Vektor Durchsatz, d.h. volle 512-bit AVX512 Exekution gibt’s dann nur im Desktop/Server Bereich. Die 8x "c" Kerne kommen wieder mit deutlichem Takt-Defizit (3.3 GHz Peak statt wie die "Großen" mit 5.1 GHz), können aber weil sie in der Tat in einem separaten CCX sind, unabhängig von den 4 Großen beim Takt eingestellt werden.

Unter dieser Betrachtung fangen die von den Twitterati (für Server) fabulierten >30% Performance Sprung pro "Kern" bzw. Sockel wieder eher Sinn zu machen, aber nur in Multithread-Szenarien (also völlig entgegen der Erwartungen bzw. sind evtl. richtige Leaks/Information falsch interpretiert worden). Für die klassischen Client Anwendungen wie Single-Thread Performance (JIT & Browser Flupdizität) und Gaming wird Zen5 aber wohl keine außergewöhnliche Offenbarung, mal schauen ob der X3D dann reicht um dort Arrow Lake Paroli bieten zu können.

Irgendwie witzig das AMD SMT krass aufbohrt (fast auf "IBM Power" Style sozusagen) während Intel (zumindest im Client Bereich) SMT abmontiert.

Der_Korken
2024-06-22, 00:02:15
Für die klassischen Client Anwendungen wie Single-Thread Performance (JIT & Browser Flupdizität) und Gaming wird Zen5 aber wohl keine außergewöhnliche Offenbarung, mal schauen ob der X3D dann reicht um dort Arrow Lake Paroli bieten zu können.

Irgendwie witzig das AMD SMT krass aufbohrt (fast auf "IBM Power" Style sozusagen) während Intel (zumindest im Client Bereich) SMT abmontiert.

Ich weiß gar nicht mehr, wo das herkommt, aber ich meine in irgendwelchen Interviews von AMD-Mitarbeitern gab es Hints, dass Zen 5 einen starken Fokus auf ST haben sollte. Bisher zeichnet sich das Gegenteil ab. Für mich deuteten die geleakten Specs - Full AVX512, 2xCache-Durchsatz, Dual Decoder - auch eher auf starke MT-Performance hin. Da auf der Folie mit den +16% IPC größtenteils MT-Benchmarks waren, würde es mich nichtmal wundern, wenn der IPC-Zuwachs in ST sogar <16% ausfällt. Die ganzen geleakten Scores von Strix Point sahen jetzt auch nicht überragend aus. Da hat jede andere Zen-Generation vorher mehr hergemacht. Ich will jetzt keinen Bulldozer-Vergleich machen, da sich Zen 5 auf einem ganz anderen relativen Niveau befinden wird, aber die Ausrichtung erinnert mich schon etwas dran. Der X3D wird wahrscheinlich reichen, um in Spielen wieder vorne zu sein, aber die "Flupdizität" sehe ich hier eher bei Intel um ehrlich zu sein.

Tesseract
2024-06-22, 00:17:58
bis auf den doppelten decoder sind das doch alles entweder ST oder neutrale änderungen, wo siehst du da MT?

iamthebear
2024-06-22, 00:23:28
Also ich weiß nicht wo ihr da eine bessere SMT Effizienz seht.

Wenn ich mir die Geekbench 6 Ergebnisse so ansehe:
ST: 1.17x
MT 1.24x trotz 50% mehre Kerne und über 2x TDP

Das sieht für mich eher nach einem Rückschritt aus.

Gipsel
2024-06-22, 02:50:48
1. Zwei CCX, wie schon vermutet. Schlecht für die Performance, könnte aber gut für den Stromverbrauch sein, insbesondere falls die Cluster unabhängig voneinander ihre Spannung beziehen können.

2. Bei der Decodergeschichte würde ich erstmal noch abwarten. Soweit ich das sehe, beziehen sich seine Aussagen dazu lediglich auf den Durchsatz mit NOPs, also ein ziemlicher Cornercase. Und je nachdem wie die Tests geschrieben sind, kann das mehr oder weniger aussagekräftig für die reale Performance sein (die dual decoder-Pipelines bei intels E-cores [ab Skymont dreifach], switchen z.B. immer bei Branches hin und her).

3. Zur MT-Performance sollte man beachten, daß dort das 4C+6c Modell getestet wurde. Der Vorteil zu den 8 großen Kernen der Vorgängergeneration ist also nicht so groß wie beim 4C+8c Topmodell. Daß dazu noch deutlich unterschiedliche Powersetting im Spiel waren, hilft natürlich überhaupt nicht.

4. Der Vorserienstatus ist nicht zu vergessen. Gab es nicht sogar eine Story von der Computex, wo bei einer Demo einem Journalisten die unerwartet niedrigere Performance in einem bestimmten Subtest auffiel, was sich letztendlich durch den (dort versehentlichen) Einsatz eines älteren Samples erklären ließ?

dildo4u
2024-06-22, 07:55:43
Ich weiß gar nicht mehr, wo das herkommt, aber ich meine in irgendwelchen Interviews von AMD-Mitarbeitern gab es Hints, dass Zen 5 einen starken Fokus auf ST haben sollte. Bisher zeichnet sich das Gegenteil ab. Für mich deuteten die geleakten Specs - Full AVX512, 2xCache-Durchsatz, Dual Decoder - auch eher auf starke MT-Performance hin. Da auf der Folie mit den +16% IPC größtenteils MT-Benchmarks waren, würde es mich nichtmal wundern, wenn der IPC-Zuwachs in ST sogar <16% ausfällt. Die ganzen geleakten Scores von Strix Point sahen jetzt auch nicht überragend aus. Da hat jede andere Zen-Generation vorher mehr hergemacht. Ich will jetzt keinen Bulldozer-Vergleich machen, da sich Zen 5 auf einem ganz anderen relativen Niveau befinden wird, aber die Ausrichtung erinnert mich schon etwas dran. Der X3D wird wahrscheinlich reichen, um in Spielen wieder vorne zu sein, aber die "Flupdizität" sehe ich hier eher bei Intel um ehrlich zu sein.
Erwartet man von Intel nicht Takt Regression mit Arrow Lake?AMD drückt hier bewusst auf die Bremse wenn Hawk Point höheren Boost hat.

5.2Ghz 8940HS

https://videocardz.com/newz/amd-announces-ryzen-8045hs-8040hs-and-8040u-hawk-point-series-powered-by-zen4-rdna3-and-xdna

5.1Ghz Strix

https://www.amd.com/de/products/processors/laptop/ryzen/300-series/amd-ryzen-ai-9-hx-370.html

Arrow Lake kann an IPC zulegen aber gleichzeitig 500Mhz Boost verlieren das ist das Gerücht.(Desktop Version)

https://www.pcgameshardware.de/CPU-CPU-154106/News/Intel-Arrow-Lake-S-Bezeichnung-1447117/

robbitop
2024-06-22, 09:13:46
Es gibt bei Intelprozessen die Historie dass der neuere Prozess weniger Takt schafft als der alte (der alte ist meist mit mehreren Iterationen dort hingekommen). Muss man mal schauen ob 20A mit dieser Tradition bricht.

latiose88
2024-06-22, 12:27:08
Naja mit Taktwunder sollte man in naher Zukunft nicht mehr rechnen.Intel will das Debakel ja nicht noch einmal haben und Amd wird versuchen sowas zu vermeiden,damit Amd nicht auch sowas erleben wird.Darum wird es beim Takt keine Wunder geben.Zumindest die 5,1 ghz sind beim 16 Kerner sicher.Bei kleineren CPUS ist ne andere Frage ob da der Takt so hoch bleiben wird.Man sieht ja den Rückgang.Mir ist es ja egal,solange am Ende ein plus an Leistung mehr übrig bleibt.Der Takt treibt nur den Stromverbrauch und die Temperaturen nach oben.Damit hat AMD es richtig gemacht.
Aber Rückgang der Leistung ,das geht garnicht.Ich schaue mir das ganz genauer an.

Altehardware
2024-06-23, 04:13:18
man kann die apu Linie nicht auf die desktop Linie gleichsetzen
Strix ist eine eigene Plattform mit Monolithen an nen 256bit Si

Desktop zen5 wird von Grund auf anders designt sein mehr fp und verbesserte Latenzen
daher nehme ich an das die 16% wirklich die ST perf ist und im Mt man sich auf grob +40% einstellen kann

davidzo
2024-06-23, 13:57:07
man kann die apu Linie nicht auf die desktop Linie gleichsetzen
Strix ist eine eigene Plattform mit Monolithen an nen 256bit Si

Strix = Monolith an 128bit
Strix Halo = Chiplet mit 256bit

Strix halo / Sarlak ist viel eher mit Fire Range vergleichbar, bloß ein anderes i/o DIE mit fetterer GPU und SI. Die Namensähnlichkeit liegt wohl eher daran für welchen Markt bzw. welche Klasse Notebooks die gedacht sind.

HOT
2024-06-23, 14:00:37
Man kann auch schon absehen, wie das Naming sein dürfte:

AI 39x/38x -> Strix Halo
AI 37x/36x -> Strix Point
AI 35x/34x -> Kraken Point
AI 33x/32x/31x -> Sonoma Ridge

Ryzen 9000 Mobile -> Fire Range, Escher Point (=Phoenix/2) und Rembrandt

Nightspider
2024-06-23, 14:27:21
Strix Point scheint ja jetzt etwas eher im Markt anzukommen, als viele erwartet haben.

Deuten die neuesten Infos bzgl Stirx Halo noch immer auf 1Q25 ?

Ramius
2024-06-23, 14:39:06
Naja mit Taktwunder sollte man in naher Zukunft nicht mehr rechnen.Intel will das Debakel ja nicht noch einmal haben und Amd wird versuchen sowas zu vermeiden,damit Amd nicht auch sowas erleben wird.Darum wird es beim Takt keine Wunder geben.Zumindest die 5,1 ghz sind beim 16 Kerner sicher.Bei kleineren CPUS ist ne andere Frage ob da der Takt so hoch bleiben wird.Man sieht ja den Rückgang.Mir ist es ja egal,solange am Ende ein plus an Leistung mehr übrig bleibt.Der Takt treibt nur den Stromverbrauch und die Temperaturen nach oben.Damit hat AMD es richtig gemacht.
Aber Rückgang der Leistung ,das geht garnicht.Ich schaue mir das ganz genauer an.

Der Takt treibt nicht nur den Stromverbrauch und die Temperaturen nach oben.

Mehr Takt bedeutet vor allem mehr Leistung, weil die CPU-Befehle in kürzerer Zeit verarbeitet werden. Oder anders herum wenn ich den Takt senke so habe ich weniger Leistung. Wenn man mit weniger Takt mehr Leistung erhalten will, dann muss es in anderen Bereichen entsprechende Verbesserungen geben wie bessere Sprungvorhersage, besseres Caching von Daten oder schnellere Verarbeitung von Speicherbefehlen etc. Aber an diesen Dingen arbeitet man auch seit einigen Generationen so dass auch dort größere Verbesserungen immer schwieriger werden. Ohne größere Verbesserungen kann man den Leistungsverlust durch den geringeren Takt aber nicht aufholen.

latiose88
2024-06-24, 01:30:03
jap und takt lässt sich auch nicht nach belieben nach oben treiben und das Problem ist ja je kleiner die fertigung desto weniger takt plus kann man auf Dauer erwarten. Somit werden wir gewiss noch an den Punkt kommen wo es immer nur noch noch kleinere Sprünge als eh schon haben noch kommen werden.

OgrEGT
2024-06-24, 06:12:59
https://videocardz.com/181601/amd-testing-strix-halo-apu-with-128gb-memory-config
AMD testing “Strix Halo” APU with 128GB memory config

HOT
2024-06-24, 08:15:13
Strix Point scheint ja jetzt etwas eher im Markt anzukommen, als viele erwartet haben.

Deuten die neuesten Infos bzgl Stirx Halo noch immer auf 1Q25 ?

Man wird versuchen, dass noch dieses Jahr die Massenproduktion der Notebooks läuft und die direkt zur CES verfügbar sind.

MSABK
2024-06-24, 08:46:52
128gb? Testen die da einfach die max Konfiguration? Für Endkunden wäre das ja unbezahlbar.

dildo4u
2024-06-24, 09:20:09
Billigste Variante an 100GB+ zu kommen für AI Entwickler.
128GB DDR5 ist ein Witz gegen HBM/GDDR6.


7900Pro 48GB 3.500€

https://geizhals.de/amd-radeon-pro-w7900-a2948314.html#offerlist

davidzo
2024-06-24, 10:32:29
Schön zu sehen das AMD richtig in die Vollen geht.
In der Windowswelt wird das Teil lange Zeit konkurrenzlos sein, Qualcomm hat sein Pulver erstmal verschossen und Intel müsste nochmal eben ein ARL-Halo aus dem Hut zaubern der laut Gerüchten längst eingestellt ist.

Die 120W TDP machen mir sorgen, denn das ist wesentlich mehr als der M3max und lässt auf dickere Formfaktoren, lautere Lüfter und weniger AKkulaufzeit schließen. Hoffentlich rennt das Ding bei reiner CPUlast eher mit 45-65W (das reicht, ist der sweetspot) und das ist nur die kombinierte Leistung mit GPUlast.
Leistungsmäßig sollte man den M3max sowohl bei der CPU / im MT als auch bei der GPU erreichen. In Blender z.B. liegt die Apple GPU mit einer 4070mobile bzw. Desktop 4060ti gleich auf und das deckt sich auch ungefähr mit den wenigen nativen gaming benchmarks. Schade nur dass bis dahin der M4max am Markt ist und wohl ausreichend vorlegen wird das Apple wieder on top bleibt. Das ist allerdings egal, da man im Windowsmarkt trotzdem konkurrenzlos dasteht.

Und 300-400$ für DRAM auf der BOM ist geradezu geschenkt wenn man das mal mit Apple vergleicht, wo man für den Aufpreis von 64GB auf 128Gb RAM schon über 800€ zahlt. Ich glaube gegenüber der CPU+GPU ist das in der BOM immer noch ein kleinerer Punkt.

Btw, ich glaube nichtmal das die CPU für AMD besonders teuer ist. Das ist bloß Fire Range mit einem neuen i/o DIE. Von der DIE Area und package ist das Ganze immer noch günstiger und weniger Aufwändig als Navi32 und nur geringfügig mehr Silizium als ein Desktop Ryzen 9000 mit dem alten i/o DIE.
Intel liegt mit seinen mainstream mobile Prozessoren (i5, i7) meist in einer Range von 200 bis 500$. Da wird AMD ganz schön Druck von oben ausüben, denn Arrowlake ist nur annähernd konkurrenzfähig wenn man noch eine mobile nvidia GPU mit bundled und selbst dann wird das Ganze größer, schwerer zu kühlen und braucht extra GDDR. Offiziell AI fähig ist das Konstrukt dann auch noch nicht, dafür bräuchte ARL ein neues i/o DIE.

amdfanuwe
2024-06-24, 10:35:00
Für Endkunden wäre das ja unbezahlbar.
Da zählst du wohl nicht zum anvisierten Kundenkreis.
Wers braucht und nutzt, dem ist es das Wert. Pros setzen das von der Steuer ab.
Gibt mit 40 CU eine nette portable Workstation.

dildo4u
2024-06-24, 10:59:48
Ryzen 370HX Geekbench 6 mit vollem Takt

https://i.ibb.co/1RM7mNW/Screenshot-2024-06-24-11-03-48-822-com-sec-android-app-sbrowser-edit.jpg (https://ibb.co/9yhcr05)

https://wccftech.com/amd-ryzen-ai-9-hx-370-zen-5-apu-strong-single-core-performance-benchmark-leak

Werte von Zen 4,Apple und Snapdragon.

https://i.ibb.co/Ltq2gV1/Screenshot-2024-06-24-11-00-43-465-com-sec-android-app-sbrowser-edit.jpg (https://ibb.co/C7XT9RQ)




https://www.computerbase.de/2024-06/windows-11-arm-snapdragon-x-elite-test/2/

Nightspider
2024-06-24, 11:05:13
Schön zu sehen das AMD richtig in die Vollen geht.
In der Windowswelt wird das Teil lange Zeit konkurrenzlos sein, Qualcomm hat sein Pulver erstmal verschossen und Intel müsste nochmal eben ein ARL-Halo aus dem Hut zaubern der laut Gerüchten längst eingestellt ist.

Die 120W TDP machen mir sorgen, denn das ist wesentlich mehr als der M3max und lässt auf dickere Formfaktoren, lautere Lüfter und weniger AKkulaufzeit schließen. Hoffentlich rennt das Ding bei reiner CPUlast eher mit 45-65W (das reicht, ist der sweetspot) und das ist nur die kombinierte Leistung mit GPUlast.
Leistungsmäßig sollte man den M3max sowohl bei der CPU / im MT als auch bei der GPU erreichen. In Blender z.B. liegt die Apple GPU mit einer 4070mobile bzw. Desktop 4060ti gleich auf und das deckt sich auch ungefähr mit den wenigen nativen gaming benchmarks. Schade nur dass bis dahin der M4max am Markt ist und wohl ausreichend vorlegen wird das Apple wieder on top bleibt. Das ist allerdings egal, da man im Windowsmarkt trotzdem konkurrenzlos dasteht.

Und 300-400$ für DRAM auf der BOM ist geradezu geschenkt wenn man das mal mit Apple vergleicht, wo man für den Aufpreis von 64GB auf 128Gb RAM schon über 800€ zahlt. Ich glaube gegenüber der CPU+GPU ist das in der BOM immer noch ein kleinerer Punkt.

Btw, ich glaube nichtmal das die CPU für AMD besonders teuer ist. Das ist bloß Fire Range mit einem neuen i/o DIE. Von der DIE Area und package ist das Ganze immer noch günstiger und weniger Aufwändig als Navi32 und nur geringfügig mehr Silizium als ein Desktop Ryzen 9000 mit dem alten i/o DIE.
Intel liegt mit seinen mainstream mobile Prozessoren (i5, i7) meist in einer Range von 200 bis 500$. Da wird AMD ganz schön Druck von oben ausüben, denn Arrowlake ist nur annähernd konkurrenzfähig wenn man noch eine mobile nvidia GPU mit bundled und selbst dann wird das Ganze größer, schwerer zu kühlen und braucht extra GDDR. Offiziell AI fähig ist das Konstrukt dann auch noch nicht, dafür bräuchte ARL ein neues i/o DIE.

Ich frage mich aber, ob die GPU mit 40 CUs dann nicht wieder zu schwach sein wird, für so cutting edge Mobile Laptop, wenn man damit AI Gedöhns machen will.

Ich erwarte von dieser RDNA3.5 GPU zumindest keine Wunder. Dafür hätte dann vielleicht schon RDNA4 verwendet werden müssen.