Intel - Raptor Lake ("RTL", Alder-Lake-Refresh, 8C+16c, 7nm, Ende 2022, Refresh Ende 2023) [Archiv]

WedgeAntilles

2021-06-11, 12:17:56

Eher 2023.
Raptor Lake wird ja nicht vor 3. Quartal 2022 rauskommen, tendenziell eher 4. Quartal 2022.

Damit wird dann eher 2023 als 2022 abgedeckt.

Aber ich bin auch recht optimistisch, dass Raptor Lake + Lovelace ein guter Zeitpunkt wird aufzurüsten.
Nötig habe ich es dann mit meinem aktuell bereits 6 Jahre alten Rechner definitiv^^

Anfang 2020 war ich mir allerdings auch sicher, dass Ende 2020 / Anfang 2021 ein toller Zeitpunkt wird zum aufrüsten, von daher ist mein Optimismus eher nix wert :(

Edit: Kleinigkeit am Rande:
Die Intel-Folie von Raptor Lake spricht über die Konkurrenz von Zen 4 und vor allem dann Zen 5/6. Dass das starke Konkurrenz wäre, sie selber dann aber auch Produkte hätten "we will also have magnitudes better products as well"
Klar, das ist Marketing-Sprech. Aber wenn man magnitude im eigentlichen Wortsinn nimmt, ergäben sich Produkte die 1000 mal besser sind.
Eine Magnitude ist etwa 30 fach "mehr". Hier wird sogar im Plural gesprochen. Also 30 x 30 = 900 x "mehr"
Wie gesagt, ist natürlich kleinlich, jeder weiß ja was gemeint ist^^

w0mbat

2021-06-11, 12:31:08

Ich würde sagen das wird DIE Gaming Plattform in 2022.
Jupp, im Budgetbereich halt. Also für die, die sich Zen4 mit +30% IPC und 3DV-Cache nicht leisten können.

/s

WedgeAntilles

2021-06-11, 12:38:56

Jupp, im Budgetbereich halt. Also für die, die sich Zen4 mit +30% IPC und 3DV-Cache nicht leisten können.

/s

Könnte sogar hinkommen.
Die Apotheke AMD mit Preisen von 500 Euro aufwärts.

Und jeder, der ein "normales" System sucht kauft Intel.

Dürfte für Intel ausreichen um auf 80% Marktanteil und mehr zu kommen.

Leonidas

2021-06-11, 12:54:56

Eher 2023.
Raptor Lake wird ja nicht vor 3. Quartal 2022 rauskommen, tendenziell eher 4. Quartal 2022.

"Holiday Season" = nicht vor November. Kann natürlich früher angekündigt/vorgestellt werden.

Gipsel

2021-06-11, 12:57:15

Eine Magnitude ist etwa 30 fach "mehr". Hier wird sogar im Plural gesprochen.Wenn nichts Anderes dransteht (oder aus dem Kontext ersichtlich ist), ist das eine (nur mittelmäßig gute/korrekte) Kurzform von "order of magnitude" und meint meist einen Faktor 10 (eine Zehnerpotenz, eine Größenordnung; eine binäre Größenordnung ist z.B. dagegen ein Faktor 2). Also außerhalb von Marketingsprech. Hier (im Marketingsprech) dürfte das einfach mit "viel" zu übersetzen sein.

JVC

2021-06-11, 13:10:29

Könnte Intel nicht auch 8Big + 8Big anbieten?

Der Little Quatsch im DD interessiert mich 0.

M.f.G. JVC

Leonidas

2021-06-11, 13:37:53

Passt womöglich nicht in 10nm rein.

= könnte unter 7nm mit Meteor Lake kommen.

MiamiNice

2021-06-11, 13:53:48

Eher 2023.
Raptor Lake wird ja nicht vor 3. Quartal 2022 rauskommen, tendenziell eher 4. Quartal 2022.

Damit wird dann eher 2023 als 2022 abgedeckt.

Aber ich bin auch recht optimistisch, dass Raptor Lake + Lovelace ein guter Zeitpunkt wird aufzurüsten.
Nötig habe ich es dann mit meinem aktuell bereits 6 Jahre alten Rechner definitiv^^

Wenn Intel mit der CPU alles richtig macht und die Vorteile von dem Big Little Kram ausspielt sehen wir 8 Ultra schnelle Kerne mit einem Broadwell like Cache + schnellem DDR5 RAM.

Das ist ein Traum für Gamer. Da wird ein System mit 16 schnellen Kernen kaum hinterherkommen innerhalb von Games. Viele Kerne sind der tot für hohe FPS.

Könnte Intel nicht auch 8Big + 8Big anbieten?

Der Little Quatsch im DD interessiert mich 0.

M.f.G. JVC

So etwas wird es dann bei AMD geben. Musste nur zugreifen.
Intel wird hoffentlich bei 8 dicken Kerne bleiben - mehr braucht man zum Gamen auch nicht. Fall die Anwendungen doch mehr Threads spawnt helfen die kleinen Kerne weit besser als große Kerne. Heutigen Spiele spawnen nur ne handvoll Threads die wirklich Last erzeugen. Das wird wohl auch erst mal so bleiben.

Felixxz2

2021-06-11, 15:05:04

Wenn Intel mit der CPU alles richtig macht und die Vorteile von dem Big Little Kram ausspielt sehen wir 8 Ultra schnelle Kerne mit einem Broadwell like Cache + schnellem DDR5 RAM.

Das ist ein Traum für Gamer. Da wird ein System mit 16 schnellen Kernen kaum hinterherkommen innerhalb von Games. Viele Kerne sind der tot für hohe FPS.

Sind das dann die "massiven Hochfrequenzkerne" von denen man immer bei Intel hört? :freak:

Aber solltest deine Erwartungen evtl. ein WENIG nach unten schrauben, dass AMD die Leistungskrone abgibt in den nächsten 1-2 Jahren ist doch sehr unwahrscheinlich. Vor allem weil mit den neuen Konsolen (beide 16 Zen 2 Threads bzw. 14 für Games) natürlich auch die CPU Anforderungen extrem steigen werden.

Lehdro

2021-06-11, 15:53:38

Fall die Anwendungen doch mehr Threads spawnt helfen die kleinen Kerne weit besser als große Kerne.
Da wäre ich nicht so sicher, da das Verhältnis entscheidend ist. Big.Little hilft primär bei der Leistungsaufnahme, sekundär bei der Fertigung (weniger mm² = günstiger & bessere Yield) und nur bei der richtigen Skalierung der Kernanzahl & Frequenzen bei der MT Leistung.

Beispiel: Ich setze SKL Kerne bei 100% IPC fest, was ja ca. Gracemont entsprechen soll. TGL setze ich 20% über SKL, ADL noch einmal 20% darüber. Macht für Golden Cove (ADLs Big Cores) 144% IPC. Jetzt müssen wir noch die Taktraten ins Verhältnis setzen: ADL ES wird mit 4.0 GHz allcore Turbo für die GCCs angeben und 3.0 GHz für die Gracemonts. Das wieder ins Verhältnis (100/144 x 0,75) ergibt etwas über 50% die ein Gracemont hat gegenüber einem Golden Cove Core. Du brauchst also 2 Gracemont um einen GCC zu ersetzen, oder anders: Ein Golden Cove Kern kann für 2 Gracemonts arbeiten. Somit wäre ein hypothetischer ADL mit 12+0 genauso schnell wie ein ADL mit 8+8. Wenn ich dann aber die Skalierung dazu nehme mit steigender TDP (wir reden immerhin von Desktop CPUs), zieht der ADL 12+0 den ADL 8+8 deutlich ab, da nach oben hin deutlich mehr Spielraum ist (ADL Gracemonts sind 3.4 GHz 1T Boost zu 3.0 nT, GCC vorerst 4.6 GHz 1T Boost zu 4.0 nT). Erst im mobile Sektor wo die TDP der definitiv begrenzende Faktor ist und allcore Loads definitiv davon hart begrenzt werden stimmt deine Aussage. Für RTL mit 8+16 heißt das aber im Umkehrschluss dass das genauso ein Vergleich mit einem RTL 16+0 sein müsste, rein leistungstechnisch gesehen. AMD hat aber schon 16 Kerne, die werden mit Zen 4 kaum weniger anbieten. Kommt also dann darauf an wie die jeweils "dicken Kerne" im Verhältnis zueinander stehen, sowohl was Leistung als auch Verbrauch angeht. Bleibt es beim bisherigen Verhältnis von Zen 3 <-> TGL, so gewinnt AMD jeden Multithreadingvergleich, da deutlich effizienter. Bessert Intel bis dahin mit ADL und dann Zen 4 vs. RTL nach, kann das durchaus aufgehen für Intel. Dagegen spricht aber das auch RTL weiterhin bei Gracemont bleiben wird und nur die Anzahl erhöht, so zumindest mein letzter Stand. AMD macht bis dahin einen Doppelsprung: Zen 4 IPC Steigerungen + 3D V Cache + 5nm. Kann also wirklich sein das AMD da weiterhin gebietsweise deutlich schneller ist, auch wenn sie eventuell die Effizienzkrone abgeben müssten, wobei das auch von Intel abhängt ob fettere Cores auch dann noch überproportional mehr Verbrauch bedeuten (siehe CML -> ICL).

Da du aber MiamiNice bist, weiß ich dass der schwachbrünstige mobile Effizienzkram nichts für dich ist. Von daher sieht es wohl so aus dass für dich die großen Kerne auf absehbare Zeit weiterhin der Faktor fürs hardcore Multithreading sein werden. Bei der ganzen Betrachtung sind übrigens Skalierungseffekte von vielen unterschiedlichen Cores, denn 8+8 (= optimalerweise min. 16 Threads) ist schwerer Auszulasten als 12 Kerne (= optimalerweise min. 12 Threads), noch gar nicht berücksichtigt, ebenso wie Schedulerprobleme, die ebenso wahrscheinlicher auftreten als bei einem homogenerem Design. Dabei ist HT noch gar nicht berücksichtigt, was das ganze nochmals etwas komplizierter macht.

MiamiNice

2021-06-11, 15:56:25

Die gesamt Leistung einer CPU ist für Gaming aber total unerheblich. Es zählt Single Core und die Anbindung an den Ram ggf. Caches.
Das Intel Design macht nur Sinn wenn die schnellen Kerne ST schneller sind als doe von AMD. Sonst wird das eine Trauervorstellung für Intel. Im Raum stehen ja auch 20-30% Mehrperformance für AL, der hat aber noch keinen Gaming Cache.

Ich denke AMD wird die Führerschaft in dem für Gamer wichtigen Bereich mit AL abgeben. Mit dem Gaming Cache wird RL vermutlich mit allen anderen CPUs den Boden aufwischen, wenn es ums Gaming geht.

Das sind zumindest meine Erwartungen mit Blick auf Broadwell.

Ps: Natürlich nur wenn sie es hinbekommen die Threads „richtig“ zu verteilen.

Schnoesel

2021-06-11, 16:59:23

Spätestens mit BF2042 werden wir sehen, dass mehr als 8 Kerne definitv von Vorteil sind. Sieht man zwar an BFV schon aber Maps für 128 Spieler sind nochmal was ganz anderes.

MiamiNice

2021-06-11, 18:45:52

Interessant ist da meiner Meinung nach eher wie viel Last diese Threads erzeugen. Zumindest aktuell ist es meist so, das 1-4 Threads massiv an den Kernen nuckeln und die restliche ihr Dasein irgendwo, meist im idle, rumdümpeln. Sollte sich das ändern, ist Big Little für Gamer natürlich für den Popo.

Ich persönlich halte es, aus meinem Laiendasein heraus, für unmöglich, dass die Entwickler es zu meinen Gaming Zeiten noch hinbekommen werden, so zu entwickeln, das alle Kerne gleichmäßig ausgelastet werden. Gaming, versteht sich.

Felixxz2

2021-06-11, 20:02:42

Distroia

2021-06-11, 23:40:15

aufkrawall

2021-06-11, 23:50:45

Der Kommentar war schon lächerlich und veraltet, bevor er abgeschickt wurde.

Nightspider

2021-06-12, 00:50:40

Intel 10nm vs. AMD 5nm...wir wissen ja wie das bei 14vs7nm lief. ^^

Miami 2021: "Games brauchen nur 1-4 Threads und Multicore Perf. ist unwichtig"

2018 ruft an:

https://abload.de/img/battlefield5vbjw6.jpg
(Battlefield 5)

Laut Turricans Test profitiert selbst das alte Battlefield 5 schon von 16 Kernen, also kann das bei Battlefield 6 nur noch massiver werden.

BlacKi

2021-06-12, 11:40:01

wenn man die 300fps halten will^^

und dann sieht man die 6c6t cpus mit 140fps+ performen.
https://youtu.be/AsB8MPVnBoY?t=180

MiamiNice

2021-06-12, 11:43:32

War klar das die Leute da wieder aus ihren Löchern kriechen.
Könnt mich ja dann Ende nächstes Jahr zitieren wenn die ersten Benches da sind.

Mangel76

2021-06-12, 11:44:13

wenn man die 300fps halten will^^

und dann sieht man die 6c6t cpus mit 140fps+ performen.
https://youtu.be/AsB8MPVnBoY?t=180

Oha, sonst werden 3FPS mehr bei 720p als Vernichtung der gegnerischen CPU gefeiert und jetzt reicht die halbe Leistung auch 😂. Kannste dir nich ausdenken...

CrazyIvan

2021-06-12, 12:37:32

Oha, sonst werden 3FPS mehr bei 720p als Vernichtung der gegnerischen CPU gefeiert und jetzt reicht die halbe Leistung auch 😂. Kannste dir nich ausdenken...
+1 :freak:

smalM

2021-06-12, 13:08:07

Klar, das ist Marketing-Sprech. Aber wenn man magnitude im eigentlichen Wortsinn nimmt, ergäben sich Produkte die 1000 mal besser sind.
Nun ja, ungefähr so relevant, wie der Quantensprung, von dem das Marketing gerne faselt.

BlacKi

2021-06-12, 13:17:29

Oha, sonst werden 3FPS mehr bei 720p als Vernichtung der gegnerischen CPU gefeiert und jetzt reicht die halbe Leistung auch 😂. Kannste dir nich ausdenken...
was meinst du?

davidzo

2021-06-12, 13:22:24

War klar das die Leute da wieder aus ihren Löchern kriechen.
Könnt mich ja dann Ende nächstes Jahr zitieren wenn die ersten Benches da sind.

Ich bin vor allem gespannt drauf wie die Leute sich da rausziehen die bei den Gracemonts immer noch an Skylake per Core Performance glauben :freak:.

Das wird wieder so eine Show wie damals mit Bonell, wo Intel großmäulig Pentium M IPC versprochen hatte und alle Leute Dothan oder Merom im Kopf, weil 2008. Letztendlich hatte man es beim launch selbst mit 1,6Ghz Takt noch schwer gegen einen 4 Jahre alten Banias Pentium M mit 1,2Ghz. - Naja, und damals ist in 4 Jahren wirklich etwas passiert bei der CPU performance im gegensatz zu intels letzten sechs bis acht jahren.
An Lakefield sieht man gut dass die Monts so weit nicht kommen. Es geht um die per Thread performance von Skylake. Und da ist ein 6700K eben nur ein quadcore mit HT. Das ADL Mont CLuster sind aber 8 Kerne ohne HT. Schon gut möglich dass sie eine per Thread IPC von Skylake erreichen. Dass sie dieselben turbotaktraten wie spätere Skylake-Arch Prozzis a la 7700k, 9900k erreichen, dass sie in lightly threaded worklodas wie skylake skalieren - eher unwahrscheinlich.

Das wird der punkt wo ich die Leute dann gerne erinnere wenn sie sich um an die 100% in der performance verschätzt haben :biggrin:

Wo bleiben eigentlich die ganzen jasper lake benchmarks? Hatte y33H da nicht schon längst ein sample? Marc hatte doch damals den besten Lakefield test gemacht der das ansatzweise potential erkennen ließ im gegensatz zu den eher enttäuschenden realworld ergebnissen des samsung galaxybook S. Da auf der Computex gerade weitere Jasperlakes in den Retail entlassen wurden, dürfte es doch eh kein NDA mehr geben, oder?

Freestaler

2021-06-12, 13:30:04

Oha, sonst werden 3FPS mehr bei 720p als Vernichtung der gegnerischen CPU gefeiert und jetzt reicht die halbe Leistung auch 😂. Kannste dir nich ausdenken...
+1, made my day

Felixxz2

2021-06-12, 13:50:57

War klar das die Leute da wieder aus ihren Löchern kriechen.
Könnt mich ja dann Ende nächstes Jahr zitieren wenn die ersten Benches da sind.

Die Bösen, sagen doch glatt dass AMD weiter vorne liegen wird, Skandal. :freak:

Ne mal echt ohne Spaß, mag ja sein, dass ADL/RTL gut performen werden, aber ein deutlicher Sieg gegen AMD ist einfach extrem unrealistisch. Vor allem nach AMDs Game-Cache.

KarlKastor

2021-06-12, 14:29:28

Ich bin vor allem gespannt drauf wie die Leute sich da rausziehen die bei den Gracemonts immer noch an Skylake per Core Performance glauben :freak:.

Wurde sowas behauptet? Es ging doch um IPC. Die Taktrate wird ja auf jeden Fall niedriger sein und HT fehlt auch. Das ist ja schon extrem utopisch, dass man zu den 8 Golden Cove noch 2x 6700 Performance dazu bekommt.

ChaosTM

2021-06-12, 14:34:42

Auch auf die Gefahr hin mich zu wiederholen. Je enger die 2 beisammen liegen, desto besser für uns. Alles andere ist sinnfreies Fanboy Gefasel.
Hoffentlich hauen die was gscheites raus. Der vertrottelt(?) programmierte FS2020 braucht jedes Quäntchen IPC/CPU Leistung.

Neurosphere

2021-06-12, 15:47:08

Platos

2021-06-12, 15:48:47

Je enger die 2 beisammen liegen, desto besser für uns. Alles andere ist sinnfreies Fanboy Gefasel.

Nein? Wenn die immer gleich aufliegen, hat es ja niemand nötig, besonders Gas zu geben. Liegt der andere Vorne, dann schon. Solange einer nicht komplett/langfristig abgehängt wird, ist das was gutes.

CrazyIvan

2021-06-12, 16:22:24

@Neurosphere
Im Grunde ist es genau wie Du es schreibst. Da Intel immer noch monolithische CPUs baut, kann man mehr große Kerne nicht ökonomisch sinnvoll darstellen.

ChaosTM

2021-06-12, 16:25:15

Das nennt man Konkurrenz. Eine quasi Patt Situation erreichst du nur mit einer ebensolcher. So bald einer zu weit wegzieht wird's teuer und die Stagnation bekommt. Sleeping Intel schon vergessen ?

Add.: Natürlich mit ausgelöst durch AMDs Schwäche über Jahre hinweg

Man kann das natürlich auch genau anders herum sehen. Ich hab halt immer eine gewisse Schwäche für den derzeitigen "Underdog" was die Performance betrifft. Genau aus oben genannten Gründen.

fondness

2021-06-12, 17:28:12

Das Teil wird definitiv meine nächste CPU.
8+16 Cores, Gaming Cache, DDR5 dürfte nicht mehr so ganz lahm sein zu dem Zeitpunkt.
Ich würde sagen das wird DIE Gaming Plattform in 2022.

Gibt es zu einem "Gaming Cache" bei Intel irgendwelche Hinweise, oder ist das reines Wunschdenken?

BlacKi

2021-06-12, 17:52:13

Gibt es zu einem "Gaming Cache" bei Intel irgendwelche Hinweise, oder ist das reines Wunschdenken?
https://cdn.wccftech.com/wp-content/uploads/2021/03/Intel-Raptor-Lake-Desktop-Mobility-CPU-Family-1030x484.jpg
https://wccftech.com/intel-raptor-lake-desktop-mobility-cpu-family-leak-expected-launch-in-2022/

w0mbat

2021-06-12, 18:44:55

Reines Wunschdenken, aber von Intel.

WedgeAntilles

2021-06-12, 18:49:56

Wenn nichts Anderes dransteht (oder aus dem Kontext ersichtlich ist), ist das eine (nur mittelmäßig gute/korrekte) Kurzform von "order of magnitude" und meint meist einen Faktor 10 (eine Zehnerpotenz, eine Größenordnung; eine binäre Größenordnung ist z.B. dagegen ein Faktor 2). Also außerhalb von Marketingsprech. Hier (im Marketingsprech) dürfte das einfach mit "viel" zu übersetzen sein.
Magnitude kommt von der Erdbebenforschung, und da ist eine Magnitude höher Faktor ca. Faktor 30.

Wird das im englischen als Synomym für "Faktor 10" verwendet? Danke, habe ich wieder was gelernt, das wusste ich nicht :)

KarlKastor

2021-06-12, 19:21:37

Reines Wunschdenken, aber von Intel.
Du kennst also schon Details?

Akkarin

2021-06-12, 19:46:57

Ob es nun ADL oder RL ist, macht das Big-little Konzept abseits von Stromsparen und für Laptops im Desktop überhaupt wirklich Sinn?

Es wirkt auf mich irgendwie wie Intels Möglichkeit die Kernzahl zu erhöhen um gegen AMD etwas im Petto zu haben aber gleichzeitig bei der Aussage bleiben zu können das 8 Kerne vollkommen ausreichen. Sofern die Dinger noch monolithisch sind (Sorry, bin da nicht up to date) hätte man vermutlich eh keine Möglichkeit wesentlich mehr Kerne realisieren zu können und ist quasi gezwungen diesen Weg zu gehen.

Wenn man hohe Taktraten fahren will hängt Intel ganz grass im Power Limit, selbst ohne explizites OC. 10nm wird hier vermutlich helfen, aber wenn man mehr MT performance haben will müssen mehr als 8C/16T her. Die little cores geben hier möglicherweise die Möglichkeit mehr Performance zu liefern, ohne wieder komplett beim Stromverbrauch aus dem Ruder zu laufen.

Der_Korken

2021-06-12, 19:48:36

https://cdn.wccftech.com/wp-content/uploads/2021/03/Intel-Raptor-Lake-Desktop-Mobility-CPU-Family-1030x484.jpg
https://wccftech.com/intel-raptor-lake-desktop-mobility-cpu-family-leak-expected-launch-in-2022/

Die Frage ist nur, was Intel damit genau meint. AMDs V-Cache kam ja so ziemlich aus dem Nichts. Wusste Intel davon und hat sowas selbst auf die Roadmap gesetzt? Einen L4-Cache bestehend aus eDRAM ist ja z.B. auch möglich. Oder einfach nur eine Vergrößerung des normalen Caches.

Gipsel

2021-06-12, 20:26:03

Magnitude kommt von der Erdbebenforschung, und da ist eine Magnitude höher Faktor ca. Faktor 30.Ganz allgemein steht das für die Größe/den Wert von irgendwas.
Und auch bei Erdbeben ist das eine logarithmische Skale (Basis 10), wo also ein um 1 höherer Wert eine um den Faktor 10 höhere Amplitude der beim Erdbeben ausgelösten Schwingungen steht. Die ~32 kommen da nur rein, wenn man die Energie des Erdbebens betrachtet (die Originaldefinition der Skale gilt aber für die Amplitude ).
Wird das im englischen als Synomym für "Faktor 10" verwendet? Danke, habe ich wieder was gelernt, das wusste ich nicht :)Auch um Deutschen steht die Übersetzung von "order of magnitude" (Größenordnung) für den Logarithmus (normalerweise Basis 10) von irgendwas. Wenn also etwas "zwei Größenordnungen höher" ist, bedeutet das Faktor 100 höher.

[B][/Off-Topic]

BlacKi

2021-06-12, 20:37:41

Die Frage ist nur, was Intel damit genau meint. AMDs V-Cache kam ja so ziemlich aus dem Nichts. Wusste Intel davon und hat sowas selbst auf die Roadmap gesetzt? Einen L4-Cache bestehend aus eDRAM ist ja z.B. auch möglich. Oder einfach nur eine Vergrößerung des normalen Caches.
performancetechnische ableitungen kann man nicht machen, das ist doch logisch. ich denke, das man gerade dabei ist die beste lösung dafür aus performance und kosten abzuwägen.

tatsache bleibt aber man bekommt:

mehr ipc über die bigcores ggü. adl

nochmals bessere performance durch größeren cache

und doppelt so viele kleine cores fürs multithreading

wieviel dann hinten bei rauskommt, naja, mehr halt^^

reaperrr

2021-06-12, 21:11:01

"Improved CPU Cache for Gaming" kann theoretisch genauso gut auch einfach nur etwas mehr L3 (4 statt 3 MB je Raptor Cove Core) und reduzierte L2-Latenz heißen, letztere ist ja bei RKL und TGL ein Grund für den mittelprächtigen Perf-Zuwachs in Spielen. Mal sehen, wie ADL in der Hinsicht wird.

Man soll niemals nie sagen, aber darauf, dass Intel bei RTL auch schon direkt auf einen gleichwertigen 3D-V-Cache setzt, würde ich Stand jetzt zumindest nicht wetten.

Fusion_Power

2021-06-12, 22:13:36

Wnn ich immer solche Werbefloskeln wie "Improved CPU Cache for Gaming" lese, bekomm ich schon Anfälle. Erinnert sich noch wer an alte Intel Werbungen wo die CPU angeblich "das Internet schneller" machen sollte? :ugly:

BlacKi

2021-06-13, 00:00:01

Man soll niemals nie sagen, aber darauf, dass Intel bei RTL auch schon direkt auf einen gleichwertigen 3D-V-Cache setzt, würde ich Stand jetzt zumindest nicht wetten.

Foveros(F2F)

wurde mit lakefield als testboot schon getestet. es ist nicht so wie bei amd wo die technik aus dem nichts kam. wenn jemand die technologie dafür besitzt dann intel. was ich damit nicht sagen will, das es auch so garantiert kommt.

CrazyIvan

2021-06-13, 00:53:00

Ganz allgemein steht das für die Größe/den Wert von irgendwas.
Und auch bei Erdbeben ist das eine logarithmische Skale (Basis 10), wo also ein um 1 höherer Wert eine um den Faktor 10 höhere Amplitude der beim Erdbeben ausgelösten Schwingungen steht. Die ~32 kommen da nur rein, wenn man die Energie des Erdbebens betrachtet (die Originaldefinition der Skale gilt aber für die Amplitude ).
Auch um Deutschen steht die Übersetzung von "order of magnitude" (Größenordnung) für den Logarithmus (normalerweise Basis 10) von irgendwas. Wenn also etwas "zwei Größenordnungen höher" ist, bedeutet das Faktor 100 höher.

[B][/Off-Topic]
+1
Danke für den schön allgemein gehaltenen - und hoffentlich die Debatte beendenden - Beitrag.

Zossel

2021-06-13, 08:28:52

Foveros(F2F)

Ab hier (https://www.forum-3dcenter.org/vbulletin/showthread.php?p=12701464#post12701464) wurde festgestellt das Intels Zeug noch zu schlecht dafür ist.

HOT

2021-06-13, 08:33:35

RTL wird ja noch monolithisch sein, erst ab MTL wird Foveros per Standard zum Tragen kommen.
Deswegen gehe ich auch davon aus, dass der "Game Cache" einfach ein größerer L3 ist und fertig.

Platos

2021-06-13, 13:03:41

Gibts ne Quelle bezüglich Foveros ab MTL ? Bin da glaube ich etwas hinterher... Ich weiss nur, dass ein "Chiplet-Design ab Meterolake kommt. Aber Foveros wäre ja das Stapeln.

davidzo

2021-06-13, 13:41:13

Ich meine Foveros ist ein Marketingname für alles was stacking ist, egal ob interposer, emib etc.
Könnte durchaus sein dass die auch TSV copper to copper bonding am Ende auch weiter Foveros nennen.

Das aktuelle Lakefield Foveros mit low cost Microbumps ist auf jeden Fall ungeeignet dafür. Es hat schon einen Grund neben der software kompatibilität wieso bei dem Cove Kern die physisch vorhandene AVX-512-Pipeline deaktiviert ist und selbst AVX2 nicht unterstützt wird. Die Taktraten sind ja auch so schon unterdurchschnittlich für einen Cove-Kern, vermutlich würde der unter dem DRAM einfach verglühen.

BTW, bin ich der einzige der es merkwürdig findet dass auf bisher jedem PCB shot von lakefield ein DRAM Chip neben dem CPUpackage sitzt? Dass man den nicht braucht war doch der eigentliche Sinn von POP? Oder bin ich nur blöd und das ist der NAND Flash Stack?
https://s3.i-micronews.com/uploads/2020/10/SP20552.pdf
EDIT: scheint wirklich nur ein UFS NAND chip zu sein. Der müsste nicht direkt neben der CPU sein, ist eher zufall und thermisch eigentlich nicht optimal (bei apple sitzen die NAND Chips an den äußersten Board Enden).

ryan

2021-12-01, 20:42:43

Some source tells me that the GLC arch has something was locked, and it will be released in the next Gen MSDT and server to counter competitors.
https://twitter.com/OneRaichu/status/1460567857947807748

In the middle of Q3, Intel’s 13th-generation Core, LGA1700, Raptor Lake, and Z790/B760 are also on the market, without H710, Intel 600/700 CPUs are compatible with each other.
By the way, the Golden Cove on Alder Lake is not full of blood. Some things are blocked. Raptor Lake may be fully opened. At the same time, the cache architecture is optimized. Although the essence has not changed much, there is still a big improvement.
By the way, Raptor Lake is also compatible with DDR4.
https://videocardz.com/newz/amd-allegedly-preparing-renoir-x-apus-without-integrated-graphics

Both SPR & Raptor Lake have enhancements & features in the big cores Alder Lake is missing.
https://twitter.com/mooreslawisdead/status/1460883183428382720

Es gibt nicht nur Verbesserungen am Cache wenn das stimmt.

latiose88

2021-12-24, 21:32:04

ok na da bin ich ja mal gespannt ob das stimmt das es nicht nur der Cache sich verbessern wird,sondern auch sogar noch mehr.Und auch wann sowas eintreten wird,bin ich ebenso gespannt drauf.

HOT

2021-12-25, 01:03:39

Wie SPR bekommt RPL offenbar 2MB L2 pro Kern, das ist alles.

ryan

2021-12-25, 01:08:47

Wie SPR bekommt RPL offenbar 2MB L2 pro Kern, das ist alles.

Wenn du das sagst kann das nur falsch sein.

latiose88

2021-12-25, 02:36:29

stimmt weil das wäre halt zu wenig Optimierung für ne neue CPU.Also von daher werden die halt noch mehr machen als nur das.Zum Glück weil das wäre ja wirklich zu wenig Steigerung dann.

robbitop

2021-12-25, 09:07:55

Ich meine, der L3 Cache wächst um 6 MiB durch die zusätzlichen E-Cores. Das mit dem "in ADL ist noch was deaktivert was in RTL aktiviert ist" klingt zwar schön mystisch - aber solche Dinge sind in der heutigen Zeit selten richtige Performanceenabler (Zeiten des sinkenden Grenzertrags und der vielen Respins).
Ich vermute keine all zu extreme IPC Explosion und so sehr wächst der Cache ja auch nicht an. Beim L2 bin ich auch skeptisch, ob das nun so viel bringt. SKL-X hatte 1 MiB L2 vs Skylake mit nur 256 kiB (also eine Vervierfachung). Und trotzdem konnte das nicht mal halbwegs die langsame Fabric abfedern.

ryan

2021-12-25, 17:07:50

Ihr geht immer nur davon aus, dass einfach nur der L2 Cache größer wird. Ich glaube das ist ein Fehler. Wenn wirklich nur der Cache anwächst ohne andere Optimierungen, würde das imho nicht viel bringen. Die Roadmap sprach von improved CPU cache for gaming, der chiphell Leak spricht von Cache Architektur Optimierung. Für mich klingt das nach mehr als nur ein größerer L2. Laut Adi Yoaz würde sich in der nächsten Generation die Cache-Hierarchie und Kapazität ändern. Es ist nur nicht klar, ob Raptor Lake mit nächster Generation gemeint ist. Könnte aber durchaus sein.

robbitop

2021-12-25, 19:46:36

Mehr Cache bringt immer was. Hitrate steigt und die CPU muss weniger warten -> effektiv mehr Durchsatz.
Der Cache von RTL ist iirc schon bekannt. 36 MiB L3 und 2 MiB L2 (pro Core).
Ich kann mir gut vorstellen, dass Intel mittelfristig auch nochmal einen L4 bringt oder den L3 vergrößert. Die Topologie soll afaik ja auch verändert werden.

latiose88

2021-12-25, 21:01:29

Ah ok also im moment sind es ja 1,25 mb pro Kern beim L2 Cache und 3 Mb L3 Cache pro Kern bzw etwas drunter. Bei L3 wäre es dann 5,5 MB L3 Cache je Kern beim Nachfolger. Und bei L2 Cache dann 2 Mb.
Bin also sehr gespannt welche Auswirkung das auf die Leistung am ende haben wird.

BlacKi

2021-12-25, 22:10:29

wenn man die e cores deaktiviert. bleibt der cache denn aktiv? das wäre meine einzigste erklärung warum die ecores gerade bei single core performance relevanten spielen in manchen fällen noch zulegen können, im vergleich gegen die deaktivierten e cores.

kurz gesagt, braucht raptor die 16 e cores um singleperformance technisch auf ipc basis gegenüber adl zuzulegen?

MiamiNice

2021-12-25, 22:46:26

Kann ich mir nicht vorstellen und differiert wahrscheinlich pro Anwendungsfall. Ich denke der RTL Effekt wird maßgeblich in Spielen durchschlagen, primär durch den größeren und schnelleren L2. Dazu wird der IMC sicherlich den ein oder anderen Mhz mehr mitmachen. Diese beiden Verbesserungen schlagen wahrscheinlich in allen Games durch. Der größere L3 wahrscheinlich eher nur bei „manchen“ Titeln.

latiose88

2021-12-26, 04:37:35

OK und wie sieht es mit Anwendung selbst aus, da ist dann l1 und l2 Cache am wichtigsten, nicht wahr?

robbitop

2021-12-26, 08:50:20

Mit deaktivierten E Cores ist der Ringbustakt deutlich höher und damit die Memorylatency geringer.

basix

2021-12-26, 10:17:43

Das wäre doch ein sinnvolles update für Raptor Lake: Inkl. E-Cores reduzierte Latenzen.

Lowkey

2021-12-26, 10:35:26

Das Handicap bei AL sind die E-cores. Aber die Lösung wäre quasi die E-cores durch P-cores zu ersetzen. Das machen sie bestimmt nicht ;)

robbitop

2021-12-26, 10:47:16

Das wäre doch ein sinnvolles update für Raptor Lake: Inkl. E-Cores reduzierte Latenzen.

Das wird vermutlich nicht besser. Der Ringbus bekommt immer mehr und mehr Teilnehmer. Bei RTL werden es ja doppelt so viele E Cores.
Intel wird sicherlich irgendwann auf eine andere Topologie umsteigen - aber die geringe Memorylatency kann man mit hoher Skalierbarkeit einfach vergessen. Entsprechend muss halt die Hitrate hoch. Nicht umsonst hat Intel mit dem sehr gut funktionierenden kleinen aber schnellen 256 kib L2 gebrochen und erhöht diesen sukzessive. Der L3 wächst auch. Und sowas wie VCache wird Intel sicherlich früher oder später auch übernehmen. Damit rückt die Bedeutung der Memorylatency immer weiter in den Hintergrund.

Wuge

2021-12-26, 11:55:11

Hm... im ASUS-BIOS untr CPU werden die Caches aufgelistet. Es gibt einen Eintrag für L4... steht im Fall von Alder Lake N/A.

robbitop

2021-12-26, 11:58:40

Tja ggf kommt sowas ja mit RTL.

ryan

2021-12-26, 12:41:09

Hm... im ASUS-BIOS untr CPU werden die Caches aufgelistet. Es gibt einen Eintrag für L4... steht im Fall von Alder Lake N/A.

Kannst du davon ein screenshot machen? Gab es so einen L4 Eintrag schon bei der LGA1200 Plattform?

Wuge

2021-12-26, 12:53:38

Naja ich könnte es fotografieren aber wozu? Steht halt unter den restlichen Einträgen.
1200 hatte ich nicht.

ryan

2021-12-26, 13:11:10

Naja ich könnte es fotografieren aber wozu? Steht halt unter den restlichen Einträgen.
1200 hatte ich nicht.

Das könnte tatsächlich der sogenannte gaming Cache sein, es würde jedenfalls Sinn machen. Einen nur größeren L2 würde man nicht so bezeichnen, denn der würde nicht viel bringen.

Ein größerer L4 dagegen würde je nach Größe, Anbindung etc. sehr viel bringen, bei Broadwell-DT hatte der L4 viel gebracht in Spielen. In Anwendungen gab es dagegen nur in Einzelfällen eine Steigerung.

Die Roadmap würde so auch mehr Sinn machen, der gaming Cache war nämlich nur beim Desktop angegeben. Im Notebook wäre es relativ sinnlos und hier könnte Intel leicht darauf verzichten. Interessant wäre ein größerer L4 allerdings für zukünftig schnellere iGPUs auch im mobilen Bereich bei Meteor Lake oder Arrow Lake.

latiose88

2021-12-26, 13:46:57

Ja sehe ich auch so, finde ich schade das cache in Anwendung nichts bringt. Habe ich ja beim doppelten l3 cache gemerkt gehabt wo am Ende keine einzige mehrleistung herausgekommen ist. Ich finde es echt schade das da nix dabei rum kommt. Beim l2 Cache steigt es in letzter Zeit kaum noch an. Darum habe ich in dieser richtung auch keine Steigerung. Nur halt durch die Eigenschaften der Kerne samt dem takt profitiere ich. Hm ich frage mich wie es weiter gehen wird. Und um ne richtige weitere Leistungsteigerung zu bekommen heißt es auf die nächste weiter Entwicklung zu warten.

ryan

2021-12-26, 18:51:18

Ich habe mal nachgeschaut, den L4 Eintrag gab es schon beim Z490. Von daher hat das bezüglich Raptor Lake nichts zu bedeuten. Vermutlich ist das ein Überbleibsel aus Broadwell Zeiten noch.

ryan

2022-01-15, 23:50:46

Q3 ist möglich nach MLID Infos. L2+L3 Cache Größe soll bei 68MB liegen laut Raichu.

#AMD better have Zen 4 ready by the end of Q3...

#Intel Raptor Lake could be out by then according to the latest info I have.

Oh, and Meteor Lake should be an even bigger deal...
https://twitter.com/mooreslawisdead/status/1481470432792436739

As per a tweet by OneRaichu, it looks like Intel's 13th Gen Raptor Lake Desktop CPUs are in for a major cache redesign. Currently, the Intel Alder Lake CPUs feature up to 44 MB of cache, that's 30 MB of L3 and 14 MB of L2 cache. But with 13th Gen Raptor Lake CPUs, the cache is said to get a boost of up to 55%.

The leaker states that the Intel Raptor Lake CPUs would feature up to 68 MB of combined cache (without adding L1 numbers).

https://wccftech.com/intel-13th-gen-raptor-lake-cpus-could-feature-up-to-55-more-cache-over-alder-lake-for-enhanced-gaming-performance/

WedgeAntilles

2022-01-16, 00:09:54

U.U. ist eines der größten Pluspunkte von RaptorLake etwas ganz unerwartetes: Der DDR4 Support.

DDR5 muss im Laufe des Jahres massiv billiger werden um attraktiv zu sein.
Kann natürlich passieren.
Muss aber nicht.

Relic

2022-01-16, 02:10:31

KarlKastor

2022-01-16, 08:24:45

Hat jemand etwas anderes erwartet? Intel hat DDR3 bis zum 9900K unterstützt...
War ja auch immer noch Skylake.

robbitop

2022-01-16, 10:57:11

Q3 ist möglich nach MLID Infos. L2+L3 Cache Größe soll bei 68MB liegen laut Raichu.

https://twitter.com/mooreslawisdead/status/1481470432792436739

https://wccftech.com/intel-13th-gen-raptor-lake-cpus-could-feature-up-to-55-more-cache-over-alder-lake-for-enhanced-gaming-performance/
2 MiB L2 pro Core ist die große Änderung. Die zusätzlichen 6 MiB L3 werden wenig bringen weil das der langsame L3 der Gracemont Cluster (Bandbreite und Latenz deutlich langsamer). Siehe ADL Artikel von chips and cheese. Im Endeffekt bleibt es bei „guten“ 24 MiB L3.

ryan

2022-01-16, 11:53:39

robbitop

2022-01-16, 12:26:44

ceed

2022-01-16, 14:10:09

Meteor ist ja dann auch zum ersten mal Intel 3 mit EUV- da sollte ein großer Sprung möglich sein.

Als Raptor Cove in der Designphase war hatte Intel sicher gegen die vielen Cores von den AMD CPUs geplant. Ich denke Zen 4 wird ne ganze Ecke schneller sein als Raptor im SingleT. Vielleicht holt man aber im Multi was wenn Zen 4 bei 16 Cores bleibt.

Nightspider

2022-01-16, 14:25:50

Distroia

2022-01-16, 14:31:20

Meteor Lake ist doch Intel 4 dachte ich?

Und Intel 4 ist das ursprüngliche Intel 7nm richtig?

Ich glaub da muss Intel erstmal zeigen das sie ihre Prozesse im Griff haben.
Sonst wird das nichts mit Intel 4 in 2023.

Ja, das stimmt. Intel 7 sollte eigentlich etwa gleichauf mit TSMCs 5 nm sein, wobei sich das auch noch zeigen muss. Es wird ja anscheinend nur wenig EUV verwendet. Sieht es als hätte Intel die Ambitionen für ihre Prozesse etwas zurückgeschraubt, könnten aber so ihre Roadmaps besser einhalten. Von daher glaube ich eher, dass Intel 4 nicht mit TSMCs 5 nm mithalten können wird.

KarlKastor

2022-01-16, 14:51:47

2 MiB L2 pro Core ist die große Änderung. Die zusätzlichen 6 MiB L3 werden wenig bringen weil das der langsame L3 der Gracemont Cluster (Bandbreite und Latenz deutlich langsamer). Siehe ADL Artikel von chips and cheese. Im Endeffekt bleibt es bei „guten“ 24 MiB L3.

Kannst du das verlinken? Ich finde nur einen Artikel der zeigt, dass die Latenz raufgeht sobald E-Cores genutzt werden. Aber keinen Unterschied in der Performance der Cache-Slices.

KarlKastor

2022-01-16, 15:00:12

Übrigens wurde der größere L2 Cache bereits im August von Adore "vorausgesagt" zusammen mit der 8+16 E Core Vergrößerung. Er hatte das gesamte lineup praktisch schon von einer Roadmap geleakt.

https://youtu.be/NQNd0_X6Ca8?t=319

Es ist immer wieder erstaunlich, wie akkurat frühe Leaks letztendlich bei Intel sind.

Die Lücke zwischen i5 und i3 wird richtig groß. i3 bleibt bei 4+0 während der i5 von 6+0 auf 6+8/6+4 ansteigt.
Naja, bestätigt ist ja noch nichts. Wobei die SKUs nicht abwegig sind. Unten rum ziemlich dünn, aber es gibt da ja auch keine Konkurrenz von AMD.

Was ich aber für völlig abwegig halte, sind die Dies. 8+16 und 8+8 sind viel zu nah beieinander und 8+16 nur für ein paar i9 genutzt. Und wozu ein 6+0 Die, wenn er für keine SKU voll genutzt wird?
Da wäre 8+16, 6+8 und 4+0 sinniger.

Gibt's eigentlich noch einen Die unter 6+0 bei Alderlake? Die Pentium und Celeron daraus zu schnitzen klingt auch nur bedingt sinnvoll.

WedgeAntilles

2022-01-16, 15:07:07

Hat jemand etwas anderes erwartet? Intel hat DDR3 bis zum 9900K unterstützt...
Ich meinte es so, dass noch vor 6 Monaten wohl keiner erwartet hätte, dass DDR5 u.U. Ende 2022 unattraktiv und teuer sein wird.

Das es eine realistische Chance gibt, dass RaptorLake mit DDR4 großflächig als sinnvollere Variante gesehen werden wird.
Das hätte vor nem halben Jahr doch noch fast jeder für extrem unwahrscheinlich gehalten.

Aber heute? Kann IMO durchaus passieren.
Viel mehr als 50-50 sehe ich nicht, dass DDR5 innerhalb der nächsten 9 Monate massiv billiger und attraktiver als DDR4 wird.
Stand heute bringt es den meisten Usern 0 und kostet - bei 32GB - fast 300 Euro mehr.

HOT

2022-01-16, 15:37:30

Ja, das stimmt. Intel 7 sollte eigentlich etwa gleichauf mit TSMCs 5 nm sein, wobei sich das auch noch zeigen muss. Es wird ja anscheinend nur wenig EUV verwendet. Sieht es als hätte Intel die Ambitionen für ihre Prozesse etwas zurückgeschraubt, könnten aber so ihre Roadmaps besser einhalten. Von daher glaube ich eher, dass Intel 4 nicht mit TSMCs 5 nm mithalten können wird.
Intel 4 entspricht N5. Intel 7 entspricht TSMCs N7. Deswegen heißen die ja so.
2 MiB L2 pro Core ist die große Änderung. Die zusätzlichen 6 MiB L3 werden wenig bringen weil das der langsame L3 der Gracemont Cluster (Bandbreite und Latenz deutlich langsamer). Siehe ADL Artikel von chips and cheese. Im Endeffekt bleibt es bei „guten“ 24 MiB L3.

Um das mal aufzuschlüsseln, dass das auch passt:

RPL:
8*2 MB L2 + 4x 4MB L2 = 32MB

3 MB * 12 Slices L3 = 36MB

Gesamt 68MB

ADL:
8* 1280kB + 2x 4MB L2 = 18MB

3 MB * 10 Slices L3 = 30MB

Gesamt 48MB

Raptor Cove wird ein minimal optimierter Golden Cove sein, nicht mehr. Außerdem verbaut man jetzt eben die größere Cache-Variante, wie im Profibereich, das wär bei Golden Cove ja auch schon möglich gewesen, die große Innovation kann ich hier nun wirklich nicht erkennen, da stimme ich dir zu.

reaperrr

2022-01-16, 15:43:17

Ich meinte es so, dass noch vor 6 Monaten wohl keiner erwartet hätte, dass DDR5 u.U. Ende 2022 unattraktiv und teuer sein wird.
Ich habe nichts anderes erwartet ¯\_(ツ)_/¯

Es war bisher eigentlich bei jeder neuen RAM-Generation so, dass die preislich halbwegs akzeptablen Mainstream-Riegel erstmal teurer und aufgrund hoher Latenzen bei mäßigem Taktvorteil langsamer als die oberen Mainstream-Riegel der vorherigen Generation waren, während die "Top-Modelle" der neuen Gen nur marginale Geschwindigkeitsvorteile zu exorbitanten Preisen bringen, alles zudem mit anfangs höchstens mittelprächtiger Verfügbarkeit, gerade bei den attraktiveren Riegeln.

Vom P/L-Verhältnis her hat der Umstieg auf NextGen-RAM direkt zum Marktstart eigentlich noch nie Sinn gemacht.

HOT

2022-01-16, 15:47:04

Na ja bei der Halbleiterknappheit hätte man darauf kommen können, wenn DDR5-Module jetzt eigene VRMs benötigen. Das wird mMn im 2.HJ kein Problem mehr sein.

ceed

2022-01-16, 15:48:00

Meteor Lake ist doch Intel 4 dachte ich?

Und Intel 4 ist das ursprüngliche Intel 7nm richtig?

Ich glaub da muss Intel erstmal zeigen das sie ihre Prozesse im Griff haben.
Sonst wird das nichts mit Intel 4 in 2023.

Ja Intel 4, nicht 3 stimmt. Immerhin fertigen sie in dem Prozess schon seit letztem Jahr, ich hab Hoffnungen dass es bis MeteorLake gut funktioniert.

WedgeAntilles

2022-01-16, 16:05:27

Ich habe nichts anderes erwartet ¯\_(ツ)_/¯

Es war bisher eigentlich bei jeder neuen RAM-Generation so, dass die preislich halbwegs akzeptablen Mainstream-Riegel erstmal teurer und aufgrund hoher Latenzen bei mäßigem Taktvorteil langsamer als die oberen Mainstream-Riegel der vorherigen Generation waren, während die "Top-Modelle" der neuen Gen nur marginale Geschwindigkeitsvorteile zu exorbitanten Preisen bringen, alles zudem mit anfangs höchstens mittelprächtiger Verfügbarkeit, gerade bei den attraktiveren Riegeln.

Vom P/L-Verhältnis her hat der Umstieg auf NextGen-RAM direkt zum Marktstart eigentlich noch nie Sinn gemacht.

Der Marktstart von DDR5 ist inzwischen aber auch schon wieder 3 Monate her.
Und da hat sich preislich bisher noch nicht viel getan.
Der Unterschied zwischen DDR3 und DDR4 war damals auch nicht derartig groß wie aktuell. Wir reden von 400 Euro vs 130 Euro, das ist Faktor 3.

Ob sich das in den nächsten 9 Moanten wirklich so wahnsinnig ändern wird?
Ich bin gespannt.
Mehr als 50-50 gebe ich dem nicht.

Ist ja aber auch relativ egal, kauft man halt DDR4 wieder wenn DDR5 dann immer noch viel zu teuer ist.

davidzo

2022-01-16, 16:11:35

Ich gehe nicht davon aus, dass RTL richtig fettig (20%+ pro Takt) zulegt wie ADL ggü seinem Vorgänger. Jedenfalls nicht durch den L2. Meteorlake ggf schon da es ja wieder ein neuer Core (Raptor Cove ist ja nur ein refresh) ist - ggf diesmal auch mit deutlich mehr L3 oder zusätzlichen L4.

Jo, ich denke auch nicht das in ST viel bei herum kommt. Die Fertigung ändert sich nicht und das mehr an Cores und der größere L2$ frisst das zusätzliche Transistorbudget auf. Raptor Cove steht auch noch nicht lange auf den Roadmaps, da erwarte ich also außer dem Cache und vielleicht ein paar neuen power-stages / turboverhalten (= firmware änderungen) nicht viel.

Aber in MT sollten die verdoppelten Monts schon für 20%+ Leistung sorgen.

Von den 2MB L2 erhoffe ich mir gar nichts in Spielen. Das kommt ja wieder zusammen mit einer entsprechenden Regression bei den Latenzen. Der Sprung von 256kb auf 1.25mb war ja auch nicht wirklich großartig. Zudem wird der Ringbus größer durch die zusätzlichen Monts, was nochmals an Latenzen kosten wird. Ganz so schlimm wie bei Skylake-X wird es nicht, der trotz gewaltig Mehrcache spürbar langsamer war als Broadwell-E, aber Zugewinne erwarte ich eben nicht im gaming, sondern eher in Cinebench und anderen studio-workloads.

Den größten Sprung (in Randcases) könnte man noch machen wenn man AVX512 wieder aktiviert, was ja auch irgendwie den Gerüchten recht geben würde bei Alderlake wäre noch irgendwas 'ungenutzt' und könnte für Raptorlake aktiviert werden. Dafür müssen die Monts das aber auch beherrschen. Alderlake sieht immer noch so aus als wäre das Deaktivieren eine erzwungene Entscheidung gewesen weil der AVX-512 support für die Monts erst mit einer jüngeren µarch fertig würde.
Chips and Cheese hat jüngstens mal ein paar L3 cache Simulationen gemacht und dabei einen 32mb 46cylce Zen3 cache gegen einen 256mb 60cacle IBM Telum cache gepitcht. Na klar sind das Birnen und ein 1.25->2mb L2 ist sicher nochmal anders, aber da szeigt grob was man erwarten kann von einem Latenzzuwachs bei mehr Cache: https://chipsandcheese.com/2021/09/29/do-ibms-giant-l3-and-v-cache-represent-the-future/
- Es gibt performance gains biszu 40%, aber die Mehrzahl der getesteten Anwendungen hate regressionen um rund 10%. Im Mittel war der 32mb Zen3 cache dann genau so schnell wie IBMs gigantischer 256mb telum cache.

Wenn man aber sieht was zwischen goldmont und goldmont+ so passiert ist (30% IPC Schub), könnte es durchaus sein dass wir bei Raptorlakes Gracemont+ größere Veränderungen haben als bei den Raptor Cove Kernen ggü. Golden Cove. Eine AVX512 fähige FPU wäre so etwas. Die muss ja nichtmal schnell sein, solange die im Silizium vorhandene AVX512 Implementierung der großen Cove kerne ordentlich schnell ist wäre das immer noch ein Win.

Distroia

2022-01-16, 16:27:22

Intel 4 entspricht N5. Intel 7 entspricht TSMCs N7. Deswegen heißen die ja so.

Ich meinte auch Intel 4, sorry. :freak: Es ging ja um Meteor Lake in Intel 4.

Wuge

2022-01-16, 16:45:15

Sie könnten schon was holen, indem sie die Atom-Cluster-Anbindung an den L3 taktfähiger machen. Statt 3,6 Ghz Ring/L3 mit aktiven eCores dann >4.8 Ghz, das wird schon in Games 5% bringen. Nochmal 5% durch den größeren L2, 2-3% durch sonstige Optimierungen und 3-4% durch 200 Mhz mehr Takt - voila 15-20% on Top ;)

ryan

2022-01-16, 16:51:46

Linmoum

2022-01-16, 17:24:52

Raptor Lake bekommt außerdem einen schnelleren DDR5 support von DDR5-4400/4800 auf womöglich DDR5-5600. Dazu etwas mehr Takt. Das kann in der Summe trotzdem 10-20% mehr performance ergeben. Es müssten eher 20% als 10% sein. Alleine schon durch den schnelleren RAM Support und etwas mehr Takt sind leicht +10% möglich in Spielen.CB hat schon mit ADL zwischen 4800 und 6000 verglichen, dazwischen liegt 1 (in Worten: ein) wahnwitziges Prozent in 720p.

ADL taktet jetzt schon mit bis zu 5.2GHz, da kommen mit Raptor Lake nicht plötzlich 6GHz out of nowhere. Und da Spiele keine bzw. so gut wie keine Vollastszenarien sind, liegt der Takt dort sowieso immer schon sehr hoch. Wenn das am Ende zusammen ~5% mehr Performance ggü. ADL bringt, kann man schon zufrieden sein. Wenn man jetzt einen klassischen Benchmarkparcous hat, würde ich wahrscheinlich Raptor Lake im Mittel auf +10% vor ADL tippen.

HOT

2022-01-16, 17:56:38

10% schafft der nur in Benchmarks, die toll auf den L2 abgehen.
Im MT geht sicherlich ein bisschen mehr, man wird knapp an den 5950X herankommen in MT-Scenarien mit den 32Threads, aber gegen Zen4? Da muss schon Arrow Lake her um den sicher zu schlagen.

ryan

2022-01-16, 18:14:23

CB hat schon mit ADL zwischen 4800 und 6000 verglichen, dazwischen liegt 1 (in Worten: ein) wahnwitziges Prozent in 720p.

Zwischen 4800 CL40 und 6400 CL40 sind es 9%: https://www.computerbase.de/2022-01/ddr5-ram-oc-intel-alder-lake-die-intel-generation-speicherstandard-xmp-3.0-takt-timings./2/#abschnitt_leistung_in_spielen

Also sollten schon 5% rausspringen von 4400/4800 auf 5600, alles andere macht kein Sinn. Bezüglich Taktfrequenz: 5.2 Ghz ist nur die 1C Last. Gaming Takt sind 4.9 Ghz beim 12900K. +200 Mhz erwarte ich schon beim 13900K. Der angekündigte 12900KS macht übrigens 5.2 Ghz gaming Takt.

5% mehr Takt und 5% besserer RAM. Könnte auch sein das der DDR5 IMC etwas besser geht in Raptor Lake. 10% sind kein Hexenwerk aus Takt und RAM.

davidzo

2022-01-16, 18:18:35

Davon geht keiner aus, keine Ahnung wie du überhaupt auf solche IPC Sprünge kommst.

Er hat doch gesagt dass das NICHT der Fall ist. Außerdem war die Rede von performance, nicht IPC. Das kann gerade bei Multicore CPUs auch mal was anderes sein.
Wie dem auch Sei,

@davidzo, Intel hat in internen Präsentationen bestätigt, dass der "gaming cache" in games was bringen wird. Die Frage wäre nur wie viel.
Kannst du dir ja mit Littles Law ausrechnen: https://en.wikipedia.org/wiki/Little%27s_law

Ich schätze dass die Latenz um mindestens 1 Cycle steigt, also von 14 auf 15cycles bzw. 5%.
In Operationen die bereits in 1.25mb L2 passen wird es also eine Regression um 5% geben. Gleichzeitig ist die Wahrscheinlichkeit von Operationen die genau zwischen 1.25mb und 2mb L2 benötigen nur 37,5% so groß wie Operationen die mit 1.25mb auskommen, wenn man eine quadratische Hitrate annimmt.
Nun ist die L2-Hitrate bei modernen CPUs bereits mit üblichen caches von 512kb Größe schon über 75%. Heraus kommt also von den 37,5% nur noch eine 9% Verbesserung durch die bessere Hitrate. Ziehe da die 5% Regression durch die Latenzen ab und du kommst auf +4%Verbesserung im Mittel, mit edgecases biszu +9%.

Von Taktraten erwarte ich ebenfalls nur +3-4%, denn 10nm+++ ist ziemlich ausgereizt.
DDR5-6400 support wird auf dem papier viel bringen, aber niemand hindert einen daran das schon mit ADL zu fahren und die Zuwächse sind so verschwindend wie Linmoum schon sagte, dass man diese 1-2% eher unter messungenauigkeit verbuchen kann. Vor allem: Je größer die Caches, desto weniger wird man vom memory system merken. Die L2 Vergrößerung spricht gerade dafür dass man durch schnelleren DDR5 noch weniger gewinnt als auf Alderlake.

ADL taktet jetzt schon mit bis zu 5.2GHz, da kommen mit Raptor Lake nicht plötzlich 6GHz out of nowhere. Und da Spiele keine bzw. so gut wie keine Vollastszenarien sind, liegt der Takt dort sowieso immer schon sehr hoch..

Ich denke auch nicht dass es Taktsprünge geben wird. Turbotaktraten sind aktuell ohnehin nur auf dem Papier gegeben und je nach System, firmware und Kühlung unterschiedlich lange verfügbar. Und die MT Taktraten werden mit mehr E-Cores mit denen man sich das Powerbudget teilt eher fallen als steigen.

Was nichts schlechtes sein muss.
Btw, die E-Cores haben auch wesentlich mehr low hanging fruits zu ernten. Im moment ist der Durchsatz in pro workloads wie cinebench und Co durch den einzelnen Ringbus-port pro 4-core cluster limitiert. Hätte man dort 2 ports würde sich die Bandbreite zum L3 verdoppeln und entsprechend auch der Durchsatz de 4Kern clusters steigen.

Gracemont ist unter Last zwar viel sparsamer als die Cove Cores, scheint aber in tellast/idle nicht gerade niedrige Leckströme zu verursachen, ganz im Gegensatz zu seinen Vorgängern Tremont und Goldmont. Hohe idle-verbrauch bei 1-Core last durch den shared L2 etc. - das sieht eher so aus wie ein density optimierter hyperscaler Server-Core wie damals was Intel mit Avoton vor hatte. Ich erwarte hier einige Verbesserungen durch besseres clock Gating und Teillastoptimierung.

Also erwarte ich in Summe 4-10% ST bzw. bei den P-Cores und +20-30% MT Leistung durch die Verdopplung der E-Cores.

ryan

2022-01-16, 18:49:04

Er hat doch gesagt dass das NICHT der Fall ist. Außerdem war die Rede von performance, nicht IPC. Das kann gerade bei Multicore CPUs auch mal was anderes sein.
Wie dem auch Sei,

Ich weiß, nur warum nimmt er überhaupt diese Zahlen in den Mund? Als wenn irgendjemand einen Golden Cove ähnlichen Sprung erwarten würde von Raptor Cove.

Kannst du dir ja mit Littles Law ausrechnen: https://en.wikipedia.org/wiki/Little%27s_law

Ich sage mal so, wenn der vergrößerte L2 nicht wenigstens 5% bringt, wäre es erstens seltsam und zweitens wäre ein "improved CPU Cache for gamers" nicht gerechtfertigt. Dass sie so etwas überhaupt erwähnen und hervorheben, gibt Hoffnung. Das zeigt mir, es muss gut was bringen. Wenn das jetzt nur sagen wir 1-3% bringen würde, wozu groß hervorheben.

Von Taktraten erwarte ich ebenfalls nur +3-4%, denn 10nm+++ ist ziemlich ausgereizt.

Das erwarte ich auch nicht, aber +200 Mhz oder vielleicht sogar 300 Mhz sind immer drin und wäre nicht das erste mal. Im Raum stehen 5500 Mhz 1C Boost bei Raptor Lake, das sind 300 Mhz über 12900K.

DDR5-6400 support wird auf dem papier viel bringen, aber niemand hindert einen daran das schon mit ADL zu fahren

Wir müssen und erstmal an den Standardtest orientieren, das ist die Norm. Viele Tests sind ja sogar nur mit DDR5-4400, weil das Intels default spec ist bei 4 slots.

und die Zuwächse sind so verschwindend wie Linmoum schon sagte, dass man diese 1-2% eher unter messungenauigkeit verbuchen kann.

Es sind aber mehr als 1-2% wenn man richtig testet.

Also erwarte ich in Summe 4-10% ST bzw. bei den P-Cores und +20-30% MT Leistung durch die Verdopplung der E-Cores.

Ich wette dagegen wenn du jetzt von der gaming Leistung sprichst. Irgendwo zwischen 10-20% tippe ich, wobei ich 15% schon fast als unteres Ende ansehen würde.

davidzo

2022-01-16, 18:58:17

Ich weiß, nur warum nimmt er überhaupt diese Zahlen in den Mund? Als wenn irgendjemand einen Golden Cove ähnlichen Sprung erwarten würde von Raptor Cove.

Nein nicht von Raptor Cove, aber von Zen4 wird 20%+ erwartet. Und das ist nunmal der relevante Gegenspieler.

Ich sage mal so, wenn der vergrößerte L2 nicht wenigstens 5% bringt, wäre es erstens seltsam und zweitens wäre ein "improved CPU Cache for gamers" nicht gerechtfertigt. Dass sie so etwas überhaupt erwähnen und hervorheben, gibt Hoffnung. Das zeigt mir, es muss gut was bringen. Wenn das jetzt nur sagen wir 1-3% bringen würde, wozu groß hervorheben.

Oder es ist einfach die Reaktion von Intels Marketing auf AMDs Marketing. Der Roadmap leak kam Anfang 2021, also nachdem AMD erfolgreich Ryzen5k mit "Ryzen game cache" gelaucht hat und vor Zen3D Leaks.

Das erwarte ich auch nicht, aber +200 Mhz oder vielleicht sogar 300 Mhz sind immer drin und wäre nicht das erste mal.

5,6Ghz in 10nm+++? Not gonna happen.

Ich wette dagegen wenn du jetzt von der gaming Leistung sprichst. Irgendwo zwischen 10-20% tippe ich, wobei ich 15% schon fast als unteres Ende ansehen würde.
Okay, ich sage 4-10% average in FHD med mit einer 3080ti. Du sagst 10-20% im selben Szenario. :biggrin: Was ist der Einsatz, ein Kasten Bier?

BlacKi

2022-01-16, 19:14:15

lol mindestens 15%durchschnitt, klar^^ im schnitt werden es irgendwas zwischen 5-10% sein, wenn man 200mhz obendrauf legt. und deutlich größer und damit teurer werden die auch.

ryan

2022-01-16, 19:19:05

Nein nicht von Raptor Cove, aber von Zen4 wird 20%+ erwartet. Und das ist nunmal der relevante Gegenspieler.

Willst du dich jetzt rausreden? Die Rede war von ADL gegenüber seinem Vorgänger:

Ich gehe nicht davon aus, dass RTL richtig fettig (20%+ pro Takt) zulegt wie ADL ggü seinem Vorgänger.

Oder es ist einfach die Reaktion von Intels Marketing auf AMDs Marketing.

Glaube ich nicht, weil die Präsentation nicht für die Öffentlichkeit gedacht ist. Ich weiß woher die Roadmap kommt, das ganze gibt es auch als Video. Und was sollte das überhaupt bringen, die Wahrheit kommt am Ende sowieso raus.

5,6Ghz in 10nm+++? Not gonna happen.

Von 5,6 Ghz hat keiner gesprochen. Der gaming Takt liegt wie gesagt bei 4,9 Ghz vom 12900K. 5,5 Ghz 1C wären 300 Mhz mehr als beim 12900K, also denke ich schon das dann 200-300 Mhz mehr beim gaming Takt logisch wären.

Okay, ich sage 4-10% average in FHD med mit einer 3080ti. Du sagst 10-20% im selben Szenario. :biggrin: Was ist der Einsatz, ein Kasten Bier?

4-10% sind alleine schon aus Takt und RAM völlig problemlos möglich, die Wette solltest du besser nicht eingehen. Nicht vergessen, deine pessimistische Sichtweise zu ADL-S im Vorfeld war am Ende ja auch nicht gerechtfertigt. Von wegen 10nm wäre nicht verbessert wurden oder Golden Cove Effizienz wäre generell viel schlechter als Zen 3.

lol mindestens 15%durchschnitt, klar^^ im schnitt werden es irgendwas zwischen 5-10% sein, wenn man 200mhz obendrauf legt. und deutlich größer und damit teurer werden die auch.

Es gibt nicht nur eine Taktsteigerung, am besten nochmal richtig nachlesen hier.

robbitop

2022-01-16, 19:37:46

Kannst du das verlinken? Ich finde nur einen Artikel der zeigt, dass die Latenz raufgeht sobald E-Cores genutzt werden. Aber keinen Unterschied in der Performance der Cache-Slices.

https://chipsandcheese.com/2021/12/21/gracemont-revenge-of-the-atom-cores/

Steht zumindest im Text. Bilder habe ich mir in der mobilen Version (hab ihn nir mit smartphone quergelesen) nicht angeschaut.

robbitop

2022-01-16, 19:49:19

@davidzo
avx512 ist leider für die meisten Consumeranwendungen uninteressant. Ich hab kürzlich von einer interessanten Ausnahme gelesen: RPCS3 - der PS3 Emulator holt +10% Performamce raus durch AVX512. Im Speziellen wird die Emulation der SPEs der CELL CPU beschleunigt. Wundert mich kaum, weil die ja tatsächlich auch GPU Aufgaben mit übernommen haben. Backface Culling und iirc Teile der Beleuchtung.
Bei ADL muss man die E Cores deaktivieren dann kann man das testen.

Das mit dem Game optimized Cache wird ja dann der größere L2 sein. Denn der schnelle L3 wird nicht größer. Mal schauen was das in Spielen bringt. Ich sehe das ähnlich wie du und würde vermuten: wenig. SKL-X war ein gutes Beispiel. Der hat den L2 Cache ggü SKL vervierfacht und hat nicht einmal annährend die größere Gesamtmemorylatency kompensieren können in Spielen. IIRC fehlten am Ende immernoch grob 10% takt und core normierte Performance.

basix

2022-01-16, 21:45:59

mMn könnte es schon der L3$ sein. +6MByte Cache und ein Beschleunigen auf Big Core Niveau: 36 MByte vs. 24 MByte bei Alderlake heisst es dann (auf schnellen L3$ bezogen). Das ist ein guter Sprung. Dazu noch 2 MByte L2$ und pre-fetching Optimierungen usw., das kann gut was bringen.

robbitop

2022-01-16, 22:04:35

Leicht gesagt. Es gibt sicher einen Grund warum die L3 cluster von Gracemont mit wenig Bandbreite und hoher Latenz versehen sind. Hat sicherlich mit Energie oder Dichte zu tun. Da RTL am Prozess nichts ändert, werden auch die Randbedingungen die gleichen sein. Warum also einen Paradigmenwechsel in so kurzer Zeit? Halte ich für unwahrscheinlich. Genauso, dass sich bei einem Refresh innerhalb eines Jahres sich signifikant was beim prefetching / branch prediction deutlich verändern sollte.
Die ist ggü den Vorgänger uArchs ja auch schon deutlich besser geworden afaik.

Historisch haben Refreshea pro Takt bei Intel seit Nehalem noch nie groß etwas gegen den „Tock“ gerissen. 1 Jahr und diesmal sogar nur gleicher Prozess bietet eben auch nicht viel Grundlage. Es gibt vor allem mehr MT und das ganze ist abgerundeter. Meteorlake wird richtig einen nachlegen IMO.

ryan

2022-01-17, 01:00:47

Das mit dem Game optimized Cache wird ja dann der größere L2 sein. Denn der schnelle L3 wird nicht größer. Mal schauen was das in Spielen bringt. Ich sehe das ähnlich wie du und würde vermuten: wenig. SKL-X war ein gutes Beispiel. Der hat den L2 Cache ggü SKL vervierfacht und hat nicht einmal annährend die größere Gesamtmemorylatency kompensieren können in Spielen. IIRC fehlten am Ende immernoch grob 10% takt und core normierte Performance.

Keine Ahnung wo SKL-X ein gutes Beispiel sein soll. Der L2 wurde zwar von 256KB auf 1 MB vergrößert, gleichzeitig ist aber auch der L3 Cache stark verringert wurden und das nicht nur ein bisschen, der wurde fast halbiert von 2,5 auf 1,375 MB pro Kern. Die Gesamt pro Kern Cache Größe von L2+L3 wurde bei SKL-X gegenüber BDW-X verkleinert. Bei Raptor Lake verringert sich der L2+L3 nicht, sie steigt. Also wo soll das ein gutes Beispiel sein.

Das größere Problem bei Skylake-X allerdings, so die wurde es damals beschrieben und so hat Intel damals die gesunkene Spiele IPC begründet, war der Wechsel vom Ringbus auf ein Mesh Interface zur Kommunikation zwischen den Kernen. Also nein, SKL-X ist kein gutes Beispiel, sondern ein schlechtes Beispiel.

robbitop

2022-01-17, 07:46:05

Selbst das 10C Modell 7900X mit 13,75 MiB L3 hat über 10% in Spielen taktnormiert auf den 8700K (6X und nur 12 MiB L3) verloren.
Der L2 hat nicht mal den Einfluss des Meshes kompensiert.

Das Problem war auch nicht die core to core latency sondern die memorylatency.
Mit timing tuning vom RAM konnte man skl-x Beine machen.

Ich bebaupte es ist ein hervorragendes Beispiel wie die gesteigerte hitrate es nicht schafft erhöhte memorylatency auszugleichen (beide haben Einfluss auf die gemittelte Zugriffslatenz auf Daten für die Ausführung von Instruktionen). Nicht mal annähernd. Zen hatte das Problem auch durch seine langsame fabric und es bedurfte viel viel mehr zusätzlichen Cache im L3 un das halbwegs in den Griff zu bekommen. Und selbst der vcache beingt nochmal irre viel in Spielen. Der zusätzliche MiB im L2 ist zwar viel schneller kst aber eben nur ein Tropfen auf dem heißen Stein. Zumal auch eine Latencyregression bei 2 MiB zu erwarten ist.

basix

2022-01-17, 09:20:15

Bei Spielen ist ein grosser L3$ und geringe Speicherlatenz definitiv wichtiger als ein grosser L2$. Hier sind die Daten anscheinend zu Divergent und mit viel Branching beaufschlagt, wodurch man einfach öfters mal in Richtung L3$ und RAM gehen muss.

Bei Zen 4 könnte DDR5 zusätzlich was bringen, da man dann effektiv ein Quad-Channel Interface hat. Das könnte helfen, um gewisse Latenzen zu maskieren.

Leicht gesagt. Es gibt sicher einen Grund warum die L3 cluster von Gracemont mit wenig Bandbreite und hoher Latenz versehen sind. Hat sicherlich mit Energie oder Dichte zu tun. Da RTL am Prozess nichts ändert, werden auch die Randbedingungen die gleichen sein. Warum also einen Paradigmenwechsel in so kurzer Zeit? Halte ich für unwahrscheinlich. Genauso, dass sich bei einem Refresh innerhalb eines Jahres sich signifikant was beim prefetching / branch prediction deutlich verändern sollte.
Die ist ggü den Vorgänger uArchs ja auch schon deutlich besser geworden afaik.

Historisch haben Refreshea pro Takt bei Intel seit Nehalem noch nie groß etwas gegen den „Tock“ gerissen. 1 Jahr und diesmal sogar nur gleicher Prozess bietet eben auch nicht viel Grundlage. Es gibt vor allem mehr MT und das ganze ist abgerundeter. Meteorlake wird richtig einen nachlegen IMO.

Natürlich wird es bei Gracemont einen Grund gegeben haben. Density wird es aber eher nicht sein, auf dem Die Shot sehe ich hier keine wesentlich dichtere Anordnung des L3 Caches. Man muss auch sehen, für was Gracemont gedacht ist und von was er abstammt. Hier ist maximale L3-Bandbreite und minimale Latenz einfach nicht gefordert. HIer die bereits bestehenden Ressourcen breiter anzubinden wäre ehrlich gesagt eine eher kleine Änderung im Vergleich zu vielen anderen Dingen, die man umsetzen könnte. Und es geht auch gar nicht darum, dass die Gracemonts schneller auf den L3$ zugreifen sollen. Das gilt nur für die P-Cores.

robbitop

2022-01-17, 11:46:22

Ist der L3 als großer Block einfach ein Teilnehmer des Ringbusses? Das war zumindest mit SKL noch so. Wenn das so ist, dann bringt auch mehr L3 der für die kleinen Cores vergrößert wurde etwas. Wobei 30->36 MiB jetzt kein besonders großer Sprung sind. Aber zusammen mit dem L2 wird es sicherlich was bringen.

Spiele sind tatächlich schon eine Art Sonderanwendung, die besonders von großem Cache profitiert. Entsprechend klar, dass man nicht zwangsweise eine ganze CPU darauf auslegt. Weiterhin ist die Idee mit dem VCache dann besonders gut da man relativ leicht entsprechende SKUs auflegen kann, für die diese Anwendung relevant ist.

Ich kann mir gut vorstellen, dass Intel mittelfristig auch Cache stacken wird. In Bezug auf Packagingtechnologien haben sie ja auch einiges da.

Wuge

2022-01-17, 11:55:12

robbitop

2022-01-17, 12:39:09

So ist es, siehe mein Post weiter vorne. Das mit den langsamen vs. schnellen L3 slices wurde offenbar falsch verstanden. Alle Bereiche des L3 sind gleich schnell, nur muss der Ring und damit der L3 von 4,7 auf 3,6 Ghz (5.0 vs. 4.2 bei OC) heruntertakten wenn die Atom Cluster aktiv sind.

Hier könnte Intel also ansetzen und das Penalty beseitigen.
Mal schauen ob das mit dem Ring noch praktikabel ist. Ggf. muss der Ring heruntertakten bei so vielen Teilnehmern damit es noch funktioniert. Oder es frisst zu viel Strom.

Über lang oder kurz wird Intel sicherlich seine Topologie auch ändern müssen. mit RTL kommen weitere 2x Gracemont Cluster dazu.

Das Problem ist, dass Skalierbarkeit und Latenz diametrale Kriterien sind. Wenn man beides will, muss man ggf wie AMD mehrere Tolologieherachien einführen. Das Problem ist dann allerdings, dass ein systemweiter Cache nicht mehr möglich/sinnvoll ist. AMD muss als "Strafe" eben pro CCX/CCD den L3 komplett vorsehen. Ist dafür innerhalb eines CCX/CCD aber auch super schnell und kann quasi beliebig viele CCX skalieren. In irgendeinen sauren Apfel wird man wohl beißen müssen.
Das CCX selbst hat (zumindest seit Zen 3) auch einen Ringbus. Aber es gibt halt auch nicht so viele Teilnehmer.

Wuge

2022-01-17, 12:56:05

Das ist ein hartes Taktlimit. Man kann den ring ja hochzwingen, bei 1.3V bis 5 Ghz auf einer guten CPU. Egal ob 2,4,6 oder 8 P cores aktiv sind. Aber sobald ein Atom Cluster aktiv wird crasht das, denn dann liegt das limit bei 4.2 Ghz. Keine Ahnung weshalb das so ist aber irgendwas in den Clustern oder deren Anbindung an den Ring limitiert den ringtakt.

Evtl. wirds mal ein kaskadierter Ring, schnell mit hoch getaktetem L3 für die P-cores und ein lahmer für die Atoms. An den Switch dann die DRAM Controller und einen 64 MB unified L4 und ab gehts ;D

r3ptil3

2022-01-17, 15:03:51

https://cdn.wccftech.com/wp-content/uploads/2022/01/Biostar-Z790-B760-Intel-700-Series-Motherboards-For-13th-Gen-Raptor-Lake-CPUs.jpg
BIOSTAR leaked schon erste Z790 Boards. Sportlich dran...

https://wccftech.com/biostars-next-gen-z790-b760-motherboards-for-intel-13th-gen-raptor-lake-desktop-cpus-leak/

Linmoum

2022-01-17, 15:12:22

Die haben doch nur die entsprechenden Namen bei der EEC eintragen lassen oder ist da jetzt noch was?

Das macht jeder Hersteller weit im Voraus und das auch für Produkte, die dann nie erscheinen werden. Geht hier ja nur um Namen.

r3ptil3

2022-01-17, 15:15:02

Aber das ganze Lineup so früh schon?

w0mbat

2022-01-17, 16:05:23

Schau dir mal die "7" an, offensichtlicher kann ein Photoshop wohl nicht sein :ugly:

davidzo

2022-01-18, 13:23:56

Bei Spielen ist ein grosser L3$ und geringe Speicherlatenz definitiv wichtiger als ein grosser L2$.
Bei AMD vielleicht, aber nicht bei Intel. Intels L3 Cache suckt, deswegen verbaut Intel ja auch nur zögerlich etwas mehr und stockt stattdessen eben den L2 auf. Es gibt in 10SF++ einfach keine vergleichbaren HD Zellen mit so einer Performance wie TSMCs 6T HD. Die 30Mb L3 von Alderlake haben bereits eine gut 40% höhere Latenz als AMDs 32mb (74 vs 54cycles).

Vergleicht man die Bandbreite außerdem mit einem Dual-Die Zen3 wie dem 5950x ist die totale L3 Bandbreite bei Intel nur ca. die Hälfte.
Das heißt aber immer noch dass die 8 P-Cores in etwa dieselbe L3 Bandbreite zur Verfügung haben wie ein Core bei AMD. Nicht gerade viel für so einen breiten Core, deswegen braucht es ja den viel schnelleren und größeren L2 und das große oOo Window um dessen Latenz zu kaschieren.

Eine Vergößerung des L3s würde bei Alderlake ja eine weitere Latenzregression bedeuten. Letztendlich ist dann bald der kleinere L3 + Gang zum DRAM effizienter, weil die Latenzregression in vielen Anwendungen Leistung kostet die in den wenigen Workloads mit größerem Dataset kaum wieder aufgeholt werden kann.

Natürlich wird es bei Gracemont einen Grund gegeben haben. Density wird es aber eher nicht sein, auf dem Die Shot sehe ich hier keine wesentlich dichtere Anordnung des L3 Caches. Man muss auch sehen, für was Gracemont gedacht ist und von was er abstammt. Hier ist maximale L3-Bandbreite und minimale Latenz einfach nicht gefordert. HIer die bereits bestehenden Ressourcen breiter anzubinden wäre ehrlich gesagt eine eher kleine Änderung im Vergleich zu vielen anderen Dingen, die man umsetzen könnte. Und es geht auch gar nicht darum, dass die Gracemonts schneller auf den L3$ zugreifen sollen. Das gilt nur für die P-Cores.
Na klar gibt es bei Gracemont einen Grund: Mehr Ringbus Stops = mehr Gesamtlatency auf L3, Memorybus etc. - das geht also zulasten der gamingleistung der P-cores.

Nicht ohne Grund hat Sapphire Rapids ja 2mb L2 pro Core (112mb pro CPU) und 105mb L3 und einen 64gb HBM L4 on top. Weil eben das Fabric sehr sehr langsam wird bei so vielen Cores (in bezug auf Latenzen, nicht bandbreite). Intel geht auf eine fully connected topologie, die zwar uniforme core to core Latenzen bietet, aber gleichzeitig auch eben sehr hohe Latenzen, da alles auf die latenz der off-chiplet Verbindungen eingebremst wird. Das ist aber Serverkram mit nahezu unlimited Power Budget (wer braucht niedrigen idleverbrauch?), insofern hier nur soviel: Intel hat den 2mb L2 schon getestet und in Produktion - und anscheinend hilft der.

Allerdings würde ich das nicht mit den Atom-wurzeln begründen wollen. Da ist kaum noch etwas von vorhanden. Gracemont ist ein vollwertiger big Core, mit extrem schnellen L1, oOo Ressourcen zum Teil größer als Zen3 und selbst die FP-Einheit ist auf Zen1 Niveau.
Das Ganze wird dann aber aus PPA Gründen an einen gemeinsamen L2 für 4 Cores gebunden der weder besonders gute Latenzen noch hohe Bandbreite hat. Für einen Core ist der L2 sogar sehr gut, aber Multicore ist Gracemont deutlich in den Möglichkeiten gedrosselt. Zudem kostet der große L2 schon bei 1-Core Last die volle Energie, was nicht so ganz ins Konzept der Stromspar-CPU passt. Das ist einfach keine echte "Little" Architektur a la Cortex A53, sondern eher eine Architektur für maximale compute Density, a la Neoverse N1 / Ampere Aaltra, amazon gravitron2. Wäre ideal für den Servereinsatz bei Hyperscalern. Viele Threads für wenig Fläche und trotzdem solide per thread performance.

So ist es, siehe mein Post weiter vorne. Das mit den langsamen vs. schnellen L3 slices wurde offenbar falsch verstanden. Alle Bereiche des L3 sind gleich schnell, nur muss der Ring und damit der L3 von 4,7 auf 3,6 Ghz (5.0 vs. 4.2 bei OC) heruntertakten wenn die Atom Cluster aktiv sind.

Hier könnte Intel also ansetzen und das Penalty beseitigen.
Wie gesagt, es ist der einzelne Ringbus Stop für ein 4-kern cluster der begrenzt, während die P-Cores viermal soviele bekommen. Dass der Takt sinkt macht überhaupt keinen Unterschied, da bei allcore Last auch der Core-clock erheblich sinkt, also der Durchsatz pro Core ohnehin sinkt.

Ein single Core kriegt nur 50gb/s L3 Bandbreite. Zen3 Cores kriegen hier 120gb/s aus dem L3, das ist vergleichbar mit dem L1 bei Gracemont.
Schlimmer ist es bei 4-Kern Last, da müssen sich 4 Cores die 60gb/s Bandbreite zum L3 sogar noch teilen.
Btw, der L1 bekommt auch keine Lorbeeren. Während GC für einen Core über 400gb/s aus dem L1 schöpft und Zen3 immerhin 300gb/s, kommt Gracemont nur auf 120gb/s. Der L2 ist genau so schnell wenn er nicht gerade mit den anderen vier Cores geteilt wird.
Das ist halt der Tradeoff der ultrakurzen L1-Latenz von 3 cycles und der erstaunlichen Größe von 96kb (beides besser als Zen3). Beinahe Apple-like das Design :wink:

Ich denke hier wird klar wieso Intel den L3 nicht weiter ausbaut. Der Ringbus, die Bandbreite pro Teilnehmer und die Latenzen sind ohnehin schon der limitierende Faktor. Deswegen auch nicht mehr als 8 P-Cores. Das skaliert einfach nicht mit mehr Cores. Mehr private cache ist sinnvoller. Daher wird eben der L2 vergrößert und nicht der L3.

basix

2022-01-18, 14:04:14

Bei AMD vielleicht, aber nicht bei Intel. Intels L3 Cache suckt, deswegen verbaut Intel ja auch nur zögerlich etwas mehr und stockt stattdessen eben den L2 auf. Es gibt in 10SF++ einfach keine vergleichbaren HD Zellen mit so einer Performance wie TSMCs 6T HD. Die 30Mb L3 von Alderlake haben bereits eine gut 40% höhere Latenz als AMDs 32mb (74 vs 54cycles).

Vergleicht man die Bandbreite außerdem mit einem Dual-Die Zen3 wie dem 5950x ist die totale L3 Bandbreite bei Intel nur ca. die Hälfte.
Das heißt aber immer noch dass die 8 P-Cores in etwa dieselbe L3 Bandbreite zur Verfügung haben wie ein Core bei AMD. Nicht gerade viel für so einen breiten Core, deswegen braucht es ja den viel schnelleren und größeren L2 und das große oOo Window um dessen Latenz zu kaschieren.

Eine Vergößerung des L3s würde bei Alderlake ja eine weitere Latenzregression bedeuten. Letztendlich ist dann bald der kleinere L3 + Gang zum DRAM effizienter, weil der die Latenzregression in vielen Anwendungen Leistung kostet die in den wenigen Workloads mit größerem Dataset kaum wieder aufgeholt werden kann.

Was ist, wenn Raptor Lake neben dem grösseren L2$ genau hier ansetzt und die L3$ Latenzen usw. eher in Richtung Zen Niveau bewegt. Kann ja sein, dass hier auch Updates am Fertigugnsprozess mit einfliessen.

Der_Korken

2022-01-18, 14:34:30

Btw, der L1 bekommt auch keine Lorbeeren. Während GC für einen Core über 400gb/s aus dem L1 schöpft und Zen3 immerhin 300gb/s, kommt Gracemont nur auf 120gb/s. Der L2 ist genau so schnell wenn er nicht gerade mit den anderen vier Cores geteilt wird.
Das ist halt der Tradeoff der ultrakurzen L1-Latenz von 3 cycles und der erstaunlichen Größe von 96kb (beides besser als Zen3). Beinahe Apple-like das Design :wink:

Man muss bei der L1D-Latenz auch den Takt berücksichtigen. 3,9Ghz ist genau 3/4 von 5,2Ghz, also ergeben 3 Takte bei Gracemont die gleiche absolute Latenz wie 4 Takte bei Golden Cove. Die 96kB sind aber L1D+L1I? Der L1D scheint nur 32kB zu haben, wenn ich mir die Latenzdiagramme von Anandtech angucke: https://www.anandtech.com/show/17047/the-intel-12th-gen-core-i912900k-review-hybrid-performance-brings-hybrid-complexity/6

Ich bin mal gespannt, ob oder wann die 4KB-pro-L1D-Assoziativität-Mauer von Intel oder AMD durchbrochen wird. Sobald man die reißt, geht kein VIPT mehr, was sofort die Latenz ohne Gegenleistung erhöht. ARM hat 16kB memory pages, da gehen 16KB pro L1D-Assoziativität, sodass Apple 128kB@8-fach UND VIPT haben kann.

HOT

2022-01-18, 15:08:13

Was ist, wenn Raptor Lake neben dem grösseren L2$ genau hier ansetzt und die L3$ Latenzen usw. eher in Richtung Zen Niveau bewegt. Kann ja sein, dass hier auch Updates am Fertigugnsprozess mit einfliessen.
Hm, wenn ich das Posting von davidzo richtig verstanden habe geht das schlichtweg in Intel 7 nicht, weil der passende SRAM fehlt. Raptor wird gar nichts hinzufügen oder ändern. Man wird ein paar Fehler aus Golden Cove rausgeholt haben und latenzen optimiert haben, etwas an der Telemetrie gearbeitet haben, den L2$ auf Serverniveau eingebaut haben und 2 weitere Gracemont-Cluster und das wars.

davidzo

2022-01-18, 15:08:58

Man muss bei der L1D-Latenz auch den Takt berücksichtigen. 3,9Ghz ist genau 3/4 von 5,2Ghz, also ergeben 3 Takte bei Gracemont die gleiche absolute Latenz wie 4 Takte bei Golden Cove. Die 96kB sind aber L1D+L1I? Der L1D scheint nur 32kB zu haben, wenn ich mir die Latenzdiagramme von Anandtech angucke:

L1I sind 64kb, also total I+D 96kb, also dieselbe Konfiguration wie Zen1.

Für normale Integer workloads ist der L1 perfekt, sieht man ja an der starken Integer performance von Zen1. Gute Latenz, ausreichende Größe und ziemlich sparsam in Power und Diefläche. Btw, Zen2 hat passend zur aufgebohrten 256bit FPU auch eine doppelt breite L1 cache Anbindung erhalten. Der L2 hat sich anschinend gar nicht verändert, aber Zen3 hat den L1 sogar verkleinert um die Latenz auf 1ns zu senken (0.9ns).

Genau wie bei Zen1 unterscheiden sich L1 und L2 bei Gracemont auch nicht groß in der Bandbreite, sondern praktisch nur in Größe und Latenz.
Nur ist der L2 eben shared, das heißt bei voller Auslastung eines clusters hat man nicht nur weniger L2 pro core, sondern auch nur noch ein Bruchteil der Bandbreite. Das problem hat Zen1 eben nicht.

Ich verstehe ja Intels Bestrebung den Core nicht zu fett zu machen, also keine dicken Vektoreinheiten welch auch entsprechende Bandbreite fordern würden, was dann wieder power und performance in Intergerlastigem Code kostet (durch größere cache Latenzen).
Aber das Cachesystem von Gracemont ist nur für halbe Auslastung eines 4-core clusters geeignet. Unter voller Auslastung aller E-Cores verdursten die Cores an der schmalen Anbindung. Das kann im Endeffekt auch nicht gut für die Power sein.

Für die MTLeistung brächte eine bessere Ringbusanbindung der E-Cores einiges. Und falls man irgendwann AVX-512 wieder ausgraben möchte, sei es auch nur indem die 128bit FPU diesen einfach nur pro-forma in multiplen cycles verlangsamt ausführt, dann benötigt man diese Bandbreite für die kleinen Cores ohnehin damit Gracemont nicht vollständig abstinkt. Raptorlake steht schließlich gegen Zen4 und dessen Cores können wohl AVX-512 und kriegen passend schnelle caches dazu. Da würden 8 schnelle P-cores nicht reichen, die e-Cores müssten wenigstens ein bisschen zur AVX-Leistung beitragen.

basix

2022-01-18, 15:48:49

Hm, wenn ich das Posting von davidzo richtig verstanden habe geht das schlichtweg in Intel 7 nicht, weil der passende SRAM fehlt. Raptor wird gar nichts hinzufügen oder ändern. Man wird ein paar Fehler aus Golden Cove rausgeholt haben und latenzen optimiert haben, etwas an der Telemetrie gearbeitet haben, den L2$ auf Serverniveau eingebaut haben und 2 weitere Gracemont-Cluster und das wars.

Genau das war mein Gedanke: Heute gibt es das in Intel 7 noch nicht. Mit Intel 7+ (:freak:) gibt es dann den heilbringenden "Game-Cache" in Form einer neuen Library

Wuge

2022-01-18, 16:48:32

Wie gesagt, es ist der einzelne Ringbus Stop für ein 4-kern cluster der begrenzt, während die P-Cores viermal soviele bekommen. Dass der Takt sinkt macht überhaupt keinen Unterschied, da bei allcore Last auch der Core-clock erheblich sinkt, also der Durchsatz pro Core ohnehin sinkt.

Ein single Core kriegt nur 50gb/s L3 Bandbreite. Zen3 Cores kriegen hier 120gb/s aus dem L3, das ist vergleichbar mit dem L1 bei Gracemont.
Schlimmer ist es bei 4-Kern Last, da müssen sich 4 Cores die 60gb/s Bandbreite zum L3 sogar noch teilen.
Btw, der L1 bekommt auch keine Lorbeeren. Während GC für einen Core über 400gb/s aus dem L1 schöpft und Zen3 immerhin 300gb/s, kommt Gracemont nur auf 120gb/s. Der L2 ist genau so schnell wenn er nicht gerade mit den anderen vier Cores geteilt wird.
Das ist halt der Tradeoff der ultrakurzen L1-Latenz von 3 cycles und der erstaunlichen Größe von 96kb (beides besser als Zen3). Beinahe Apple-like das Design :wink:

Ich denke hier wird klar wieso Intel den L3 nicht weiter ausbaut. Der Ringbus, die Bandbreite pro Teilnehmer und die Latenzen sind ohnehin schon der limitierende Faktor. Deswegen auch nicht mehr als 8 P-Cores. Das skaliert einfach nicht mit mehr Cores. Mehr private cache ist sinnvoller. Daher wird eben der L2 vergrößert und nicht der L3.

Ich glaube wir reden an einander vorbei... ja, der L3 ist schwach an die Atom Cluster angebunden. Das ist für Spiele aber egal. Die ganzen Hintergrundthreads und was sonst noch an "Gelump" auf den Gracemont cores läuft ist nicht limitierend.

Die P-Cores haben aber schnelle Ports an den L3. Hier bremst jedoch der auf 3,6 Ghz reduzierte Takt. Ob die P Cores nun mit 4.8, 4,9 oder 5 Ghz laufen sei mal dahin gestellt - ein Ring/L3 der statt mit 3,6 dann mit 4,8 Ghz läuft beschleunigt die P-Cores ganz sicher. Ich kann bei Gelegenheit ja mal messen...

Und die Taktregression kommt nicht durch die 1 oder 2 Ringstops per se, denn die Ring Agents und die L3 Slices sind immer alle aktiv. Auch eine Abschaltung einzelner P-Cores hebt das Taktpotenzial nicht.

Es ist explizit die Aktivierung eines oder mehrerer Atom-Cluster die den hohen Takt unmöglich macht. Also irgendwas zwischen dem Atom-Cluster-L2 und den Ring-Agents der Atom-Cluster. Wird das beseitigt, profitieren die P-Cores, da sie eben mit 4,8 statt 3,6 Ghz mit einander und mit dem L3 kommunizieren können. Ergo, Potenzial für Raptor Lake - das ist alles was ich sagen wollte.

HOT

2022-01-18, 16:57:08

Genau das war mein Gedanke: Heute gibt es das in Intel 7 noch nicht. Mit Intel 7+ (:freak:) gibt es dann den heilbringenden "Game-Cache" in Form einer neuen Library
Wenn das so einfach wär gäbs das schon längst. Ich denke Intel wird das bis Intel 4 aussitzen.

robbitop

2022-01-18, 17:20:27

Für die MTLeistung brächte eine bessere Ringbusanbindung der E-Cores einiges. Und falls man irgendwann AVX-512 wieder ausgraben möchte, sei es auch nur indem die 128bit FPU diesen einfach nur pro-forma in multiplen cycles verlangsamt ausführt, dann benötigt man diese Bandbreite für die kleinen Cores ohnehin damit Gracemont nicht vollständig abstinkt. Raptorlake steht schließlich gegen Zen4 und dessen Cores können wohl AVX-512 und kriegen passend schnelle caches dazu. Da würden 8 schnelle P-cores nicht reichen, die e-Cores müssten wenigstens ein bisschen zur AVX-Leistung beitragen.
Es gibt ja Gerüchte die besagen, dass in ADL was deaktiviert ist, was in RTL aktiviert wird. Das kann AVX512 sein (dann halt multi cycle für die E Cores).

Genau das war mein Gedanke: Heute gibt es das in Intel 7 noch nicht. Mit Intel 7+ (:freak:) gibt es dann den heilbringenden "Game-Cache" in Form einer neuen Library
Also nur moderate Steigerung der Größe 30 -> 36 MiB bei aber gleichzeitiger Latenzverbesserung? Das wäre allerdings hilfreich. Aber mal schauen. 10 nm ist ja mittlerweile auch schon wieder auf der ettlichsten Iteration. Cannonlake -> Sunny Cove -> Willow Cove -> Golden Cove -> Raptor Cove. Also 10 nm+++++
Die Frage ist am Ende wie viel das letzte "+" noch bringt. In der regel nähert man sich ja asymptotisch einem Ziel an (sinkender Grenzertrag) - bedeutet, dass die ersten Schritte die größten sind und die letzten die kleinsten.

Wenn das so einfach wär gäbs das schon längst. Ich denke Intel wird das bis Intel 4 aussitzen.
Den Gedanken hatte ich eben auch. Zumal man dann mit MTL auch eine neue uArch hat, bei der man eh die wesentlich größeren Änderungen erwarten kann. Refreshes haben historisch bei Intel nie viel gebracht.

davidzo

2022-01-19, 14:40:47

Es ist explizit die Aktivierung eines oder mehrerer Atom-Cluster die den hohen Takt unmöglich macht. Also irgendwas zwischen dem Atom-Cluster-L2 und den Ring-Agents der Atom-Cluster. Wird das beseitigt, profitieren die P-Cores, da sie eben mit 4,8 statt 3,6 Ghz mit einander und mit dem L3 kommunizieren können. Ergo, Potenzial für Raptor Lake - das ist alles was ich sagen wollte.

Dann erkläre mir mal wieso zwei zusätzliche Ringbus stops das genau auslösen, aber die anderen 8 davor nicht.
Ich glaube du verwechselst hier Korrelation mit Kausalität. Das hat nichts mit den Busstops zutun, sondern mit der TDP und der Leistungs-Verteilung und der Firmware. Sicher, das könnte man auch etwas feingranularer machen, aber wer weiß, vielleicht kommt ja noch ein Biosupdate oder schedulerupdate welches das tut.
CB hat ja auch 8+0 getestet und der 12900k hat dann konsistent sogar etwas mehr Package Power gehab als bei als 8+8.
Im 255W TDP Korsett ist Alderlake also auch mit 8+0 TDP limitiert. Einen großen Anteil daran hat der Ringbus. Die Einsparungen durch eine leichte Taktabsenkung des Ringbus reichen aus um damit 8 zusätzliche E-Cores zu betreiben. CB hat im CoronaBench sogar einen Rückgang der gesamten Leistungsaufnahme zu verzeichnen, obwohl die Performance um 32% steigt.

Wenn du den Ringbus immer bei Volltakt fahren willst, musst du den Coretakt der P-Cores reduzieren, was erheblich mehr Leistungseinbußen nach sich zieht.
Auch möglich dass Intel bei Raptorlake auf 300W+ TDP geht, aber wahrscheinlich ist es nicht, da der Sockel+boards ja gleich bleiben sollen.

Den Leistungsabfall des L3 caches auszugleichen ist eher eine Schedulerfrage. Also lohnt es sich die E-cores zu bemühen, oder läuft der workload besser auf 8+0. Weil solange die E-cores mit ausgelastet werden können bringt das definitiv mehr Leistung als die 2-3% die bei den P-Cores verloren gehen. Und um diese 2-3% zu messen braucht man schon extrem cache-sensitive workloads wie komprimierung und dekomprimierung.
Ich bezweifle dass das irgendeine Relevanz hat für Gaming und wenn, dann lässt sich das auch mit einem Schedulerupdate fixen.

Btw, Alderlakes Cachesystem ist sowieso ziemlich imbalanced. L1 und L2 sind für maximale Bandbreite konstruiert anstelle von Latenz. Das kann man eigentlich nur bei stark vektorisiertem Code überhaupt auslasten, selbst AVX2 reicht da nicht.
Capframe-X hat mit AVX 256bit 450gb/s herausgeholt. Mit AVX512 (+ deaktivierten E-Cores, was nicht alle BIOSe können) kommt er auf fast 650gb/s.

Das Cache-system ist also ganz klar für AVX512 workloads designed, eine Featureabschaltung war bei der Planung des Designs sicher nicht im Gespräch.
Die Volle Leistung der P-Cores sehen wir dann also erst bei den Sapphire Rapids basierten HEDT CPUs.

Insofern kann ich mir für Raptorlake als Refresh bzw. Optimierung nur zwei Dinge vorstellen:
1. Die kleinen cores bekommen AVX-512 support. Damit können die großen Cores auch ihr ungenutztes Potential in edge-cases ausspielen.
2. Man baut AVX-512 endgültig aus der FPU von Raptor-Cove aus und verbessert die Latenzen und Größe der Caches auf Kosten der Bandbreite welche bisher von normalem Code nicht genutzt werden kann.

Letzteres wäre auch spannend, denn bessere Latenzen der davor liegenden private Caches würden sich auch auf die Ringbus und totale DRAM Latenz positiv auswirken. Das könnte für Gaming tatsächlich besser sein als AVX-512 support für alle Cores.

Wuge

2022-01-20, 11:54:04

Dann erkläre mir mal wieso zwei zusätzliche Ringbus stops das genau auslösen, aber die anderen 8 davor nicht.
...weil die Anbindung der Atom-Cluster an deren Ring-Agents nicht mehr als ca. 4200 Mhz verkraften. Irgendwas hemmt den Takt und darauf wollte ich hinaus.

Ich glaube du verwechselst hier Korrelation mit Kausalität. Das hat nichts mit den Busstops zutun, sondern mit der TDP und der Leistungs-Verteilung und der Firmware. Sicher, das könnte man auch etwas feingranularer machen, aber wer weiß, vielleicht kommt ja noch ein Biosupdate oder schedulerupdate welches das tut.
CB hat ja auch 8+0 getestet und der 12900k hat dann konsistent sogar etwas mehr Package Power gehab als bei als 8+8.
Im 255W TDP Korsett ist Alderlake also auch mit 8+0 TDP limitiert. Einen großen Anteil daran hat der Ringbus. Die Einsparungen durch eine leichte Taktabsenkung des Ringbus reichen aus um damit 8 zusätzliche E-Cores zu betreiben. CB hat im CoronaBench sogar einen Rückgang der gesamten Leistungsaufnahme zu verzeichnen, obwohl die Performance um 32% steigt.

Wenn du den Ringbus immer bei Volltakt fahren willst, musst du den Coretakt der P-Cores reduzieren, was erheblich mehr Leistungseinbußen nach sich zieht.

Das ist ja alles schön und gut aber das meine ich nicht. Es gibt eine harte Taktwall. Ich hab hier (wie viele andere Overclocker mit ähnlichen Ambitionen auch) ne Kühlung die 350W wegschafft und offenes Powerlimit. Deine ganzen aus produktpolitischer Sicht richtigen Ausführungen hin oder her, wenn ich diese ganzen Restriktionen beseitige bleibt es dabei: 10 Ringstops, 30 MB L3 nur mit P Cores kann ich bis 5 Ghz takten. Aktiviere ich die Atom-Cluster stürzt die Bude bei mehr als 4.2 Ghz ab.

Die Ringstops selbst sind es demnach nicht (denn die sind auch dann aktiv wenn die Atoms schlafen), sondern die aktiven Atom-Cluster.

BlacKi

2022-02-18, 00:13:30

rofl. wenn raptor q4 22 kommt und meteor q2 23, dann wird raptor doch nur für die interessant, die bei ddr4 bleiben wollen, ansonsten kannst du auch gleich auf meteor warten...

und bis zu 10% mehr performance ist zwar nicht schlecht innerhalb eines jahres, aber gabs da nicht prognosen einiger von avg +15%?

r3ptil3

2022-02-20, 16:45:52

Bisschen einfache Spekulation/News-Recherche

"Intel 13th Gen Raptor Lake CPUs Bring Up To 15% Single & 40% Multi-Thread Performance Gains In Q3 2022 To Tackle AMD Ryzen 7000 ‘Zen 4’ Chips"

https://wccftech.com/intel-13th-gen-raptor-lake-cpus-bring-up-to-15-single-40-multi-thread-performance-gains-in-q3-2022-to-tackle-amd-ryzen-7000-zen-4-chips/

Um realitätsnah zu bleiben 10% IPC+ für ST und MT halt deutlich mehr wegen den weiteren E-Cores.

Interessant finde ich hierbei einzig, dass die Stimmung in den Kommentaren sich langsam aber sicher "pro Intel" bewegt. :D

ryan

2022-02-20, 16:54:45

Linmoum

2022-02-20, 16:58:52

Intel hat mit "up to double digit performance boost" ja schon selbst im ersten Schritt angedeutet, wo sich RTL platzieren wird.

Man wird die MT-Performance deutlich mehr in den Fokus rücken, weil sich hier durch +8 E-Cores auch der größte Fortschritt erzielen lässt. Dass ST nicht sonderlich viel bei einem Refresh hinzukommen wird, kann man mittlerweile fast schon als gesichert ansehen.

Wenn sich das wirklich nur bei ~10% bewegt - und teils auch darunter - hechelt Intel wahrscheinlich wieder hinterher. Abseits von ST dürfte Perf/Watt übel werden.

ryan

2022-02-20, 17:02:14

Nicht wirklich, up double digit geht bis 99%. Es kann durchaus sein, dass Intel sich nicht in die Karten schauen will und deswegen schwammig von up to double digits spricht. Oder sie haben ein RPT mit deutlich geringeren Taktraten getestet. Oder es bezog sich nur auf ST und nicht auf MT Leistung.

Linmoum

2022-02-20, 17:08:27

Ach komm. Wenn ich mit "bis zu zweistellige Performancegewinne" für mein neues Produkt werbe, fangen direkt die Alarmglocken an zu schrillen. Gerade, wenn ich Intel heiße. Und RKL ist jetzt auch noch nicht so lange her. Bei Intel weiß man, was offizielles Marketing dann am Ende des Tages gerne mal bringt. Nämlich insgesamt sogar noch weniger, als man anhand offizieller Angaben erahnen konnte.

Dass jetzt auch auf irgendwelche frühen Samples zu schieben oder dass man sich ja bloß nicht in die Karten schauen lassen will, halte ich für abwegig. Das ist keine neue Architektur und/oder kein neuer Prozess. Das ist ein ADL-Refresh und selbst wenn da jetzt noch 100MHz ST-Clocks fehlen, macht den Braten auch nicht fett.

ryan

2022-02-20, 17:16:56

Es sind Raptor Cove Kerne und es sind +8 E Kerne. So einfach ist das also nicht, wie Du es darstellst. Die Angabe von Intel ist viel zu schwammig. Wobei das sogar eine Übereinstimmung sein kann mit MLID, wenn Intel hier von ST spricht. MLID spricht von +8-15% ST.

r3ptil3

2022-02-20, 17:29:43

@ryan

Einfach mal die alten Folien vergangener Gens von Intel anschauen :)

Wenn Intel selber von 10% spricht, dann wird das, das höchste der Gefühle sein.

Und insbesondere der Perf/Watt dürfte, wie Limoun schon erwähnt hat, wirklich alles andere als gut sein. Die Architektur ist ja praktisch noch die gleiche, gleicher Fertigungsprozess...

Ich tippe aber bei der Performance, ausser in MT lastigen Anwendungen, auf eine sehr ähnliche Leistung zu Zen4.

ryan

2022-02-20, 17:38:44

@ryan

Einfach mal die alten Folien vergangener Gens von Intel anschauen :)

Wenn Intel selber von 10% spricht, dann wird das, das höchste der Gefühle sein.

Sie sprechen ja nicht von 10%, sondern von double digits. Also genau genommen bis 99%. Auch unterscheidet Intel nicht zwischen ST und MT.

Der_Korken

2022-02-20, 18:29:47

15% mehr ST-Performance fände ich schon erstaunlich viel. Das ist mal eben so in der selben Kategorie wie Zen 2 und fast so viel wie Zen 3, Rocket Lake und Alder Lake jeweils brachten. Da mit Meteor Lake in gut einem Jahr bereits die nächste "neue" Architektur kommen soll, frage ich mich wo Intel das hernehmen will? Ich mein, nichts gegen schnellere Produkte, aber so ein Tempo wäre historisch fast schon einmalig, selbst verglichen mit der Prä-Sandy-Bridge-Ära.

Linmoum

2022-02-20, 19:35:44

ST =! IPC. Zen3 war in ST-Apps mal eben rund 25% schneller als Zen2.

Aber höherer Takt und mehr Cache werden RTL natürlich helfen, wenn auch nicht überall.

Intels "bis zu zweistellig..." impliziert für mich fast schon zwingend, dass es Fälle geben wird, wo der Performancezuwachs nur einstellig ist. Da wir 8 E-Cores mehr haben, kann man MT-Szenarien in der Hinsicht ausschließen. Wo wir wiederum bei ST-Apps und ggf. Spielen wären.

~10% im Schnitt über einen umfangreichen Benchmarksparcours halte ich für realistisch. MT-Apps wg. der +8 E-Cores natürlich ein gutes Stück mehr. Da RTL aber grundsätzlich nur ein ADL-Refresh zu werden scheint und es derselbe Node ist, bin ich schon gespannt darauf, wie Intel das alles in eine ähnliche TDP quetschen will. Oder sie geben Perf/Watt komplett auf für das letzte bisschen an Leistung, noch mehr als schon mit ADL.

Tarkin

2022-02-20, 19:38:31

WOW toller "leak"... die zahlen kann ich mir auch aus dem Arsch ziehen wenn ich 5 Minuten drüber nachdenke LMAO!

10% mehr ST klingt ned unrealistisch (+5% IPC, +5% Clocks), aber 40% mehr MT is zu viel IMO.... 30-35% werdens werden (zwecks Powerlimit)

brauch ich voll die Sources direkt aus Intel... mhm... Sorry, aber der Typ macht doch aus jedem Shice ein ECXLUSIVE LEAK Video nur um mehr Ad-Views zu generieren.

Und Q3 ist auch voll die Überraschung weil Intel Ende Q3 noch nie CPUs gelauncht hat :eek::biggrin::freak:

Der_Korken

2022-02-20, 19:41:48

OK, das mit dem Takt stimmt, aber wir kleben jetzt schon lange bei 5,2-5,3Ghz fest, sowohl mit Skylake@14nm, Cove@14nm und Cove@10nm. Der 12900KS mit 5,5Ghz wird massiv selektiert sein und nur in homöopathischen Mengen auf den Markt kommen. Dass Raptor Lake da nennenswert was rausholt, halte ich für unwahrscheinlich. MT ist natürlich außen vor, da können die Gewinne durch mehr Kerne natürlich relativ hoch liegen (sollte Gracemont nicht auch ein Architektur-Upgrade bekommen?).

Nightspider

2022-02-21, 02:43:55

dildo4u

2022-02-21, 08:01:22

Nicht vergessen Intel 4 ist ehemals 7nm wenn das 2023 kommt ist da schon extrem spät.

https://www.computerbase.de/2021-05/intel-meteor-lake-der-compute-tile-der-7-nm-cpu-feiert-tape-in/

Nightspider

2022-02-21, 08:41:44

Guck dir Intels 10nm Roadmap an, dann ist es extrem früh.

robbitop

2022-02-21, 08:59:18

Wie viele Design Teams hat Intel das sie alle 9-12 Monate ein neues CPU Design auf den Markt werfen können? O_o

Zumal Intel bei Meteor Lake einen neuen Prozess (Intel 4) nutzen wird.

Wie hoch stehen die Chancen das Meteor Lake püntlich kommt? :rolleyes:
Naja es ist ein wie bis zu Haswell. 1 Jahr das neue Design und dann das Folgejahr ein Refresh. Dann wieder das neue Design.

Dafür braucht man 2x Teams, die sich leapfroggen. Die hat AMD auch.
Allerdings arbeitet Intel gleichzeitig an den kleinen Cores. Wobei das nichts Neues ist - die gab es mit Atom ja auch vorher schon.

Im Prinzip sind sie jetzt einfach nur wieder zurück auf dem Execution Level auf dem sie bis Haswell waren.

Wobei MLID neulich erzählt hat, dass sie aber mehr Architecture Teams aktuell haben und ganz viel ausprobiert und zur Not verworfen werden darf.

---------------

Zu den Fertigungsroadmaps muss man sagen: es ist das eine Datum, wann ein Prozess fertig ist und das andere Datum wann es das erste gelaunchte Serienprodukt gibt. Dazwischen liegt dann etwa 1 Jahr.

y33H@

2022-02-21, 09:42:20

Intel hat primär zwei Teams - in Haifa und in Hillsboro -, plus eins in Austin.

w0mbat

2022-02-21, 12:12:09

Dass RTL so schnell auf ADL folgt ist jetzt nicht so unerwartet, ist im großen Ganzen ja "einfach" ein refresh. Ich wäre zwar eher wieder von Oktober/November ausgegangen, aber September macht ja den Braten nicht fett.

Die Frage ist eher, ob MTL nach Plan kommt, oder ob es da wieder Verzögerungen gibt. Wenn Intel das hinbekommt sind sie für mich wieder "on track".

HOT

2022-02-21, 12:21:06

Wobei klar sein dürfte, dass Mitte 2023 erst die P-Varianten von MTL kommen, dafür wird man sich eine P-Variante von RPL sparen. Die bisherigen Folien zeigten oft nur 4 Big-Cores. Die S-Variante würde ich ebenfalls nicht vor September 2023 erwarten. Von da aus dürfte Zen5 nicht allzu weit weg sein, das Spiel geht also weiter.

Nightspider

2022-02-21, 15:44:39

Wobei MLID neulich erzählt hat, dass sie aber mehr Architecture Teams aktuell haben und ganz viel ausprobiert und zur Not verworfen werden darf.

Intel hat primär zwei Teams - in Haifa und in Hillsboro -, plus eins in Austin.

Das macht schon mehr Sinn. Aktuell strebt Intel ja scheinbar neue Produkte nach 9-10 Monaten an, also fast 2 Designs in 1,5 Jahren. Da braucht man mehr als 2 Teams.
Genug Kapital hat Intel ja um diverse Teams mit Geld zu beschmeißen damit die RnD Abteilung neue Designs am laufenden Band bringt.

Kurzfristig wird Intel aber weiter durch die eigenen Prozesse ausgebremst imo. Aber gut das man wenigstens viele kleine Schritte macht als jahrelang gar nix voranzubringen.

Aber AMDs Produkte in N5 und N3 werden nochmal schwere Zeiten für Intel. Aktuell kommt man ja nicht mal bei der Effizienz an AMDs N7/N6 Produkte heran.
Obwohl mir noch ein Vergleich zwischen ADL und Cezanne fehlt im 15-28W Bereich.

Zen5 soll ja relativ zeitig kommen, zuletzt wurde gemunkelt "nur ein Jahr nach Zen 4". Dann muss sich Intel nicht nur mit N5 herumschlagen, N3 soll nochmal um die 30% Effizienz bringen.
Im Desktop kann Intel noch gut mithalten weil es vielen Enthusiasten egal ist ob die CPU 250W verballert.
Aber im HPC Markt siehts eher schlecht aus gegen Zen4 Genoa mit 96 Kernen und Zen4c Bergamo mit 128 Kernen, sowie mit der besseren Effizienz im mobilen Bereich und dann noch Zen5+N3.

Für uns werden das hingegen 2-3 tolle Jahre die auf uns zukommen.
Geforce und Radeon Karten werden auch einen riesigen Sprung machen innerhalb des nächsten Jahres.

Da wirds wieder Spaß machen PC-Gamer zu sein. :D

Dann fehlt nur noch Crysis4 und so ein paar Hardware-Zerstörer von Ubisoft. (Avatar?) :D

=Floi=

2022-02-21, 15:52:23

Wie viele Design Teams hat Intel das sie alle 9-12 Monate ein neues CPU Design auf den Markt werfen können? O_o

Das schlimme ist ja die modellflut und das packaging. Alleine was für jedes einzelne modell draufgeht. Das ist ein gigantischer kostenblock und rattenschwanz, der eigentlich völlig unnötig ist, wenn die zyklen und die schritte größer und länger wären.

Nightspider

2022-02-21, 16:04:58

Jain, kürzere Zyklen sind insofern kundenfreundlicher, als das es kaum einen falschen Zeitpunkt gibt Hardware zu kaufen wenn die Unterschiede kleiner sind und man zu jedem Zeitpunkt aktuelle Leistung geboten bekommt.

Wenn du dir früher 1,5 Jahre nach einem CPU Release zwingend ein neues Gerät kaufen musstest, konntest du halt auch mal ins Klo greifen, wenn kurz danach ein großer Sprung erfolgt ist.

Jedes Jahr eine neue GPU Gen mit einem Sprung von 1,3x bis 1,5x würde dem Kunden auch entgegenkommen.

=Floi=

2022-02-21, 16:18:27

rocket zu tigerlake ist auf dem papier die igpu gewachsen. Für mich ist es leider der gleiche schrott, weil beides dann zu langsam ist. Bei ersterem hat man auch noch nicht so heftig am boost gedreht.

Man bekommt bei intel nur immer eine salami scheibe und zahlt dafür fürstlich. Teilweise verscherbeln sie durch ihre kleinen schritte auch alten krempel sauteuer.
6700er
7700er
8700er
Die kann man heute alle in die tonne treten und waren im nachhinein ihr geld nicht wert.
Die super selektirten, teuren halo modelle braucht auch niemand.

4-5 modelle mit der selben modellnummer :ugly: oder der sparsame einsatz der K freischaltung müssten einfach nicht sein. Bei intel zahlt man für jeden kleinen mist! Jedes gramm cache und jedes mhz mehr.
Bei AMD bekommt man es einfach!

Die firma frustiriert mich mit ihrer politik schon sehr. Bis zum brechen die ganze produktpalette optimiert und die produkte selbst sind dann oft mittelmässig.
Der tolle 6 core leistung und dann hat er als budget-cpu keine igpu. :rolleyes:

Nightspider

2022-02-21, 16:20:35

Würde ich so nicht unterschreiben. Das die Jahre 2012 bis 2020 öde waren, darüber brauchen wir nicht sprechen.

Aber der 8700K war nicht besonders teuer, hatte +50% Kerne und ließ sich super übertakten und über DRAM tunen.

Mit dem 8700K, gerade getuned, kann man auch heute noch super zocken.

ceed

2022-02-21, 19:22:59

Das macht schon mehr Sinn. Aktuell strebt Intel ja scheinbar neue Produkte nach 9-10 Monaten an, also fast 2 Designs in 1,5 Jahren. Da braucht man mehr als 2 Teams.
Genug Kapital hat Intel ja um diverse Teams mit Geld zu beschmeißen damit die RnD Abteilung neue Designs am laufenden Band bringt.

https://www.youtube.com/watch?v=AFVDZeg4RVY&t=800s

In dem Interview sagt Keller dass die Silicon Eng. Abteilung ca. 10'000 Mitarbeiter hat. Sind vielleicht 3 Standorte aber kann mir nicht vorstellen dass die nur drei "Teams" in dem Sinne haben.

Die haben (in seiner Zeit dort oder generell zeitgleich, dazu ist mein Englisch zu schlecht) an 60-70 SOC's gearbeitet.

robbitop

2022-02-21, 20:19:30

Naja erstmal müssen sie unter 12 Monaten auch konsistent abliefern bis man das glauben kann.

Mit Teams sind konkret CPU uArch Teams gemeint. Implementierung die ganzen anderen IP Blocks haben natürlich noch andere Teams. Aber gerade moderne CPU uArchs sind etwas so Komplexes, dass es nicht so extrem viele Leute gibt, die das auf dem Level können wie es nötig ist um ganz oben mitzuspielen. Das erfordert viel Berufserfahrung besonderes Talent. Die gibt es nicht wie Sand am Meer. Entsprechend schwer kann man das skalieren.

MiamiNice

2022-03-17, 10:31:27

Gibt es mittlerweile eine ungefähres Release Datum? Wird hier langsam Zeit für ein Upgrade.

w0mbat

2022-03-17, 10:41:34

Q3 war der letzte Stand.

BlacKi

2022-03-17, 11:13:09

aber ende q3

w0mbat

2022-03-17, 11:14:35

Ja, aber genau wissen wir es halt nicht.

MiamiNice

2022-03-23, 15:41:31

Was mich aktuell ein wenig anpisst sind die Gerüchte zu Ram Support bei RTL. Angeblich will Intel keine DDR4 Boards mit dem passendem RTL Chipsatz zulassen. D.h. man muss entweder mit einem ADL Board arbeiten oder den langsamen DDR5 Speicher kaufen. Beides klingt maximal ungeil, wobei da das alte ADL Board noch das kleinere Übel ist.
Ich würde gerne den 13900k mit 5000er DDR4 Riegeln betreiben und erst zum Meteor Lake Refresh auf DDR5 upgraden, wenn es hoffentlich schnelleren DDR5 gibt.
Blöd.

BlacKi

2022-03-23, 16:03:29

das ist sowieso sehr unwahrscheinlich das der memory controller mit gear 1 ddr4 5000 laufen wird. und gear 2 willst du nicht wirklich.

lowkey hat schon angemerkt das ddr5 probleme hat, das mit den neuen z790 boards wohl behoben sein wird. ich wüsste daher nicht, warum ich nicht direkt auf ddr5 bei einem neuen system gehen würde. 16gb sind sowieso nur ein preislicher kompromiss, der bei 32gb nichtmehr zieht, es sei denn man will wirklich ein budged build machen, was eigentlich keinen sinn macht beim topmodel.

MiamiNice

2022-03-23, 16:56:19

Das ist doch gar nicht der Punkt XD
Du lootest die Grenze des IMC aus, fährst den RAM synchron, und die "über Kapazität" des RAMs verbrauchst mit manuellem Timing OC :biggrin:
Es geht hier nicht ums Geld, rein um den Speed. DDR5 ist aktuell nicht zu gebrauchen, egal wie viel Geld Du in den Speicher kippst.

r3ptil3

2022-03-24, 01:23:01

Dafür gibt es doch Z690 DDR4 Boards, welche kompatibel sind mit dem 13900k.

iamthebear

2022-03-24, 12:53:04

Wieso braucht man überhaupt Z790 Boards wenn Z690 auch alle neuen Standards wie PCIe 5.0 unterstützen?
In Kombination mit DDR5 kann man das ja eventuell mit höherem Speichertakt rechtfertigen aber bei DDR4 sehe ich da keinen zwingenden Bedarf für einen neuen Chipsatz. Einfach eine Revision 2.0 auflegen, die schon ab Werk mit bassendem aktuellen BIOS kommt fertig.

BlacKi

2022-03-24, 13:17:22

deswegen ist es auch unwahrscheinlich das z790 ddr4 supporten wird.

WedgeAntilles

2022-03-24, 13:43:04

Ich sehe da auch kein Problem.
Z790 ist der Enthusiastenchipsatz, der auch wieder teuer wird.

Wer bereit ist dieses Geld zu bezahlen wird meist sowieso DDR5 kaufen.
Und wer DDR4 will, will dies meist aus Preis-Leistungs-Gründen.
Derjenige will dann aber auch ein Board für 120 Euro und keines für 240 Euro.

B660 für DDR4
Z790 für DDR5

Ja, es wird ein paar Einzelfälle geben, die gerne eine Mischung hätten.
Aber unterm Strich dürfte diese Lösung für die breite Masse ganz gut passen IMO.

Gipsel

2022-05-20, 16:53:57

Noch nichts zu den Cachegrößen von RaptorLake?
2MB L2 pro P Core und 4MB shared L2 pro E-Core-Cluster (4 Kerne) und dann 3 MB L3 pro P-Core und E-Core-Cluster.
Für das Topmodell (8P+16E) sind das dann insgesamt 32MB L2 und 36MB L3. Der L3 muß dann ja effektiv quasi exklusiv zu den L2s sein, damit der für die Hitrate noch was bringt. Mal sehen, welche Latenzen intel da hinbekommt.

Wobei das offenbar alte News sind (https://www.pcgamer.com/13th-gen-raptor-lake-cpus-could-feature-significant-cache-size-increases/), die nur gerade noch mal neu hochgekocht wurden.

basix

2022-05-20, 16:58:42

32MB L2-Cache?! :D

Da würde es sich ja enorm lohnen, wenn man L2/L3-Caches in ein Base Die auslagern würde.

BlacKi

2022-05-20, 17:28:06

Der L3 muß dann ja effektiv quasi exklusiv zu den L2s sein, damit der für die Hitrate noch was bringt. Mal sehen, welche Latenzen intel da hinbekommt.

was trotzdem nicht wirklich viel bringt. denn es sind eben keine 32mb L2 die man zusammenzählen darf. es gibt ja keine verbindung zwischen den einzelnen L2 cache mengen so wie bei L3.

die cpu wird nur massiv größer und der performance boost ist eher mäßig. aber hey, cinebench rockt bestimmt mit 16 littles.

Wuge

2022-05-20, 19:45:24

Die little core Cluster bekommen auch ne L2 Verdoppelung? Hmm.. na schau ma mal.
L3 ist doch jetzt schon exklusive L2.

davidzo

2022-05-23, 17:24:39

die cpu wird nur massiv größer und der performance boost ist eher mäßig. aber hey, cinebench rockt bestimmt mit 16 littles.

Nicht wirklich.
Die quadcore Cluster von GMT sind gerade mal 8,78mm2 groß, kaum größer als ein einzelner Golden Cove Core. Die 2mbL2 davon sind 2mm2.

Die 8 zusätzlichen E-Cores + L2 Verdopplung für alle machen gerade mal 26mm2 Diefläche aus, mit dem zusätzlichen L3 sind es 36mm2

Die L2 Vergrößerung der P-Cores kostet 19mm2 für alle 8 Cores. Der L2 wächst von 1,49mm2 auf 2,384mm2 pro Core.

https://twitter.com/Locuza_/status/1453524285260247046/photo/1

Insgesamt ist es also ein Zuwachs von lediglick 55mm2 bei RTL vs ADL, vorbehaltlich irgendwelcher IGP Verbesserungen.

Die little core Cluster bekommen auch ne L2 Verdoppelung? Hmm.. na schau ma mal.
L3 ist doch jetzt schon exklusive L2.

Das wird schon was bringen, da die little Cores im moment bei fully MT-workloads unter ihren Möglichkeiten performen: https://chipsandcheese.com/2021/12/21/gracemont-revenge-of-the-atom-cores/

Besser wäre zwar den L3 Latenzärmer zu machen, bzw. höher zu takten (zum Beispiel indem man die stops für die IGP entfernt) oder die Bandbreite pro quadcore GMT Cluster zu verdoppeln, aber das sind handfeste Architektur redesigns. Bleibt man bei der Architektur und verbessert weiter die bisherigen Stärken des Designs, dann gelangt man auch bei Gracemont zum L2. Genau wie bei Golden Cove witzigerweise :biggrin:

Theoretisch ist die IPC von Gracemont sehr hoch, ähnlich wie die von den lakes oder Zen2. Der L1 ist sehr Latenzarm, der L2 ausreichend groß und die Bandbreite reicht für die meisten Integer workloads. Aber eben nur wenn du nur 1x Core pro Cluster auslastest. Wenn du alle Cores in einem Cluster belastest reicht der L2 nicht, die Misses gehen in den L3 und der ist mit 74cycles endslahm, und der ROB von GMT zu klein um das zu kaschieren. Deswegen kommt GMT auch trotz der niedrigen Taktraten in Multithread Workloads nicht an die Performance von zen2 oder die Lakes heran.

Das ist ein Widerspruch in der Architektur an sich, die für möglichst hohe PPA gedacht ist. Trotz sehr vielen Cores pro Fläche ist sie in MT workloads nicht gut, weil die vielen Cores an mangelnder Bandbreite verhungern. In Vectorized Workloads limitiert noch viel mehr, aber bereits bei Integer Mt workloads bremst die schmale Anbindung des L3 und die hohe Latenz. Ich meine hier teilen sich 4 Cores die Bandbreite von einem Golden Cove Core :freak: - was kann man da erwarten?

ryan

2022-06-02, 22:59:47

Neueste Raptor Lake-S Performance Gerüchte vom userbench und Raichu.

Compared to a Core i9-12900K system, however, the Raptor Lake configuration in question ties with an average bench score of 114%. That being said, the multi-core performance seems to be up to 32% higher compared to the Core i9-12900K owing to the higher core/thread count.
https://www.notebookcheck.net/Intel-Raptor-Lake-S-24C-32T-CPU-with-Arc-A770-spotted-on-UserBenchmark-with-4-6-GHz-average-boost-and-up-to-32-higher-multi-core-performance-compared-to-Core-i9-12900K.624892.0.html

The latest performance rumor comes from none other than @OneRaichu who was accurate with his Alder Lake performance claims. Now the leaker has said that Intel's upcoming Core i9-13900K, the flagship of the 13th Gen Raptor Lake lineup, could offer a score of over 2300 points within the Geekbench 5 benchmark. Just for comparison sake, the Intel Core i9-12900K Alder Lake CPU scores around 2000 points while the AMD Ryzen 9 5950X 'Zen 3' CPU sits at around 1700 points
https://wccftech.com/intel-raptor-lake-core-i9-13900k-15-percent-faster-i9-12900k-35-percent-faster-amd-ryzen-9-5950x-single-thread-benchmark-performance-rumor/

Leonidas

2022-06-09, 08:07:05

Raptor Lake vs Zen 4 Performance-Vorhersagen (gemäß Hersteller-Folien):
https://www.3dcenter.org/news/news-des-8-juni-2022

HOT

2022-06-09, 09:19:10

Im MT mit den größeren L2$es könnte man durchaus etwas vorne sein, das klingt plausibel. Das Ding wird im MT aber ein furchtbarer Säufer werden.

davidzo

2022-06-09, 11:36:33

Im MT mit den größeren L2$es könnte man durchaus etwas vorne sein, das klingt plausibel. Das Ding wird im MT aber ein furchtbarer Säufer werden.

Das befürchte ich auch. Bei den aktuellen Taktraten von 3,7-3,9Ghz bedeuten +8 E-Cores nochmal +50Watt obendrauf.
Der L2Cache wird bei den P-Cores nichts zum MT Ergebnis beitragen. Höchstens der vergrößerte E-core Cache wird ein bisschen was bringen, aber nicht viel.
Die Mehrleistung muss also alleine durch die +50% E-Cores kommen.

Wenn man das Ziel hat AMD in MT Workloads zu schlagen, dann müssen diese +50% aber auch vollständig durchkommen, es ist keine Taktratengegression erlaubt.

Der 5950x liegt in MT noch rund 10% vor dem 12900k und Zen4 soll ja laut AMD sogar +46% vor dem 12900k legen. Das heißt die E-Cores werden wieder über die Kotzgrenze getaktet.
Die P-Cores sind in MT gar nicht das problem, die sind selbst bei 4,2Ghz noch effizienter als die E-cores bei 3,9Ghz. Erst bei 5Ghz saufen die so absurd viel und das tritt in MT workloads nunmal nicht auf.

Die E-Cores skalieren sehr schlecht über 3Ghz bzw. über 3Watt per Core Power. Bei 3,7Ghz sind es bereits 6Watt, bei 2800 nur 3W. Die letzten 1Ghz auf 3,7-3,9 kosten also genau soviel power wie die ersten 3Ghz. Da sind dann sogar die P-Cores effizienter als die E-cores, denn die skalieren vernünftig bis 15-20Watt per Core Power. Der absolute Sweetspot liegt sogar bei nur 1,4Ghz. Da verbrauchen die E-Cores nur kaum mehr als die Hälfte der Energie wie bei 3Ghz, bzw. 1/6 der Energie von P-Cores auf 5Ghz für denselben Job.
https://chipsandcheese.com/2022/01/28/alder-lakes-power-efficiency-a-complicated-picture/

Meine Hoffnung war, dass man bei 16 E-cores nicht mehr auf so sinnlos hohe Taktraten für die kleinen Kerne geht, sondern bei unter 3Ghz bleibt.
Aber mit einer 25% Taktregression werden aus den +50% mehr Kernen eben nur noch + 37,5%. Das reicht für den 5950x locker, aber nicht für Zen4 sofern AMDs Blender-Werte ein realistisches Bild für MT workloads zeichnen.

robbitop

2022-06-09, 11:42:24

Kann man das als Enduser nicht auch optional selbst einstellen?

basix

2022-06-09, 11:46:15

Soweit ich weiss, kann man bei Alderlake den E-Core Takt separat von den P-Cores festlegen.

Der_Korken

2022-06-09, 11:52:36

Die Mehrleistung muss also alleine durch die +50%+100% E-Cores kommen.

Aber mit einer 25% Taktregression werden aus den +50%+100% mehr Kernen eben nur noch + 37,5%50%.

Kein Einspruch, wollte nur die Zahlen fixen. Es sind 16 statt 8 E-Cores und wenn die 25% niedriger takten, kommen nicht 75% Leistung dazu, sondern nur 50%, denn die alten Cores verlieren ja auch Takt.

robbitop

2022-06-09, 11:55:24

Soweit ich weiss, kann man bei Alderlake den E-Core Takt separat von den P-Cores festlegen.

Dann verstehe ich die Aufregung nicht. :)

][immy

2022-06-09, 12:24:07

Raptor Lake vs Zen 4 Performance-Vorhersagen (gemäß Hersteller-Folien):
https://www.3dcenter.org/news/news-des-8-juni-2022
Würde mich im MT nicht wundern. Immerhin hat der Raptor hier 24 "echte" Cores zur Verfügung für 32 Threads. Der Zen4 wohl "nur" 16 Kerne. Solange die Kerne alle keine Spezialaufgaben übernehmen sollten sich die kleineren Kernchen sehr gut schlagen können.
Bei Spielen sehe ich auch weiterhin nicht, das die merklich über mehr als 6 Kerne skalieren. Die eine oder andere Ausnahme wird es sicherlich geben, aber meist sind die anderen Kerne kaum sinnvoll ausgelastet.

Aber Intel hat ja auch schon bei den aktuellen CPUs gezeigt, das sie bereits sind, beim Verbrauch voll aufs ganze zu gehen um alles raus zu kitzeln was irgendwie möglich ist um Benchmarks zu gewinnen. Irgendwie ist das ganze etwas widersprüchlich. Auf der einen Seite "sparsame" Kerne einzusetzen, damit man im Laptop-Bereich relativ Energieeffizient dar stehen kann und auf der anderen Seite hat man raus was irgendwie geht um Benches zu gewinnen. Aber so gesehen schon eine erstaunliche CPU, das sie eine solche Palette abdecken kann.
Hoffe wir mal, das nicht wieder irgendwelche Sicherheitsfeatures vernachlässigt wurden.

ceed

2022-06-09, 12:27:55

Für die Mobile Varianten soll auch noch

https://www.pcgameshardware.de/CPU-CPU-154106/News/Intel-Raptor-Lake-Effizienz-1383530/

hinzukommen. Mit mehr E-Cores kauft Intel mit Wafer-Fläche Effizienz. Machen sie bestimmt nicht gern.

ryan

2022-06-09, 12:56:26

Das befürchte ich auch. Bei den aktuellen Taktraten von 3,7-3,9Ghz bedeuten +8 E-Cores nochmal +50Watt obendrauf.
Der L2Cache wird bei den P-Cores nichts zum MT Ergebnis beitragen. Höchstens der vergrößerte E-core Cache wird ein bisschen was bringen, aber nicht viel.
Die Mehrleistung muss also alleine durch die +50% E-Cores kommen.

Unwahrscheinlich, die PL2 soll bei 253W liegen. Also 5% über ADL-S. Auch soll die Effizienz gestiegen sein, was leicht machbar ist und sich mit den bisherigen Infos deckt. Die brauchen nur leicht mit dem Takt runter, den Rest erledigen die +8E Kerne. Das ist insgesamt so viel effizienter. Schon ADL-S war nicht per se ineffizient. Ineffizient wurde es nur durch die sehr hohen Taktraten. Wahrscheinlich gibt es kleinere Optimierungen hier und da am bestehenden Design und der Fertigung, das ist völlig normal und sollte nicht überraschen. 50% mehr Energie wären 361 Watt beim PL2. Du schreibst echt derben Stuss manchmal.

Dann verstehe ich die Aufregung nicht. :)

Das Problem ist die Spannung, es gibt nur eine voltage rail bei Alder Lake. Das heißt ein gestiegener Takt der P-Kerne macht die E-Kerne automatisch mit ineffizienter, das versteht er nur nicht.

davidzo

2022-06-09, 13:03:26

Kein Einsprung, wollte nur die Zahlen fixen. Es sind 16 statt 8 E-Cores und wenn die 25% niedriger takten, kommen nicht 75% Leistung dazu, sondern nur 50%, denn die alten Cores verlieren ja auch Takt.

Nein, nicht in bezug auf die MT Leistung. Es sind aktuell 16 Cores und in Zukunft 24C. Also ein Zuwachs von +50% an Cores. Ich schrieb in dem Satz etwas von MT Leistung und da kann man die P-Cores nun schwerlich einfach ausblenden.
Ich gehe auch nicht davon aus dass Intel den Takt der E-cores reduzieren wird. Denn sonst landet man wieder deutlich hinter Raphael 16C/32T, der ja vor allem bei den sustained MT Taktraten einen Riesensprung machen soll.

Der 5950x schafft bisher sustained 3,75Ghz auf allen Cores bei 6Watt per Core Power (exkl uncore). Btw, das ist lustigerweise genau die gleiche per Core Power wie Gracemont bei nahezu gleicher Taktrate von 3,7Ghz. Nur ist Zen3 dabei wesentlich schneller.

Den blender benches und cinebench nach soll Zen4 in MT workloads 30-40% schneller sein als Zen3 (46% schneller als der 12900k). Bei nur 8% IPC Zuwachs wären das also mindestens 20% mehr Takt.
4,8Ghz sustained in MT workloads bei per Core Verbräuchen von 10-12Watt 8uncore ist etwas sparsamer) sind nicht unrealistisch imo.

[immy;13026242']Würde mich im MT nicht wundern. Immerhin hat der Raptor hier 24 "echte" Cores zur Verfügung für 32 Threads. Der Zen4 wohl "nur" 16 Kerne. Solange die Kerne alle keine Spezialaufgaben übernehmen sollten sich die kleineren Kernchen sehr gut schlagen können.

Nicht ganz realistisch. Die "echten" Cores wachsen nur um 50% an, die TDP dabei aber nicht im selben Maße. Und selbst wenn man die kleinen kerne weiter mit ineffizienten Taktraten wie über 3Ghz füttert wie beim 12900K, reicht das ganze wenn es hoch kommt für +30 - +40%. Nach den ersten Leaks schafft Zen4 in MT workloads gegenüber dem 12900K aber mehr als +40% mit 16T/32C.

basix

2022-06-09, 13:08:42

Das Problem ist die Spannung, es gibt nur eine voltage rail bei Alder Lake. Das heißt ein gestiegener Takt der P-Kerne macht die E-Kerne automatisch mit ineffizienter, das versteht er nur nicht.

Wenn du damit mich meintest: Doch verstehe ich. Wusste ich nur nicht ;)

davidzo

2022-06-09, 13:17:41

Wenn man keine Rhetorik von Aussagen trennen kann, sollte man sich mit Beleidigungen lieber zurückhalten Ryan.
Unwahrscheinlich, die PL2 soll bei 253W liegen. Also 5% über ADL-S. Auch soll die Effizienz gestiegen sein, was leicht machbar ist und sich mit den bisherigen Infos deckt.

Natürlich wird die Effizienz besser sein wenn man einen Prozess und Core-design12 Monate länger lang tunen konnte. Dem habe ich auch gar nicht widersprochen.

Die brauchen nur leicht mit dem Takt runter, den Rest erledigen die +8E Kerne.

Genau, das könnte man machen. Der Kern meiner Aussage bezieht sich aber auf die Aussage aus dem heutigen 3Dcenter Newsartikel. Also darauf, dass 16 E-Kerne nunmal nicht ausreichen um eine +50prozentige MT Verbesserung zu erziehlen.
Und damit ist Greymon55s Aussage aus der heuztigen News höchstwahrscheinlich nur Bullshit:
The dinosaur 's MT performance is better than the artist's, but both are ES at present, it is not clear what the artist's TDP is, and the final win or loss will be determined by TDP and all core frequency.
Und Intel hat uns in der Vergangenheit ja schon mehrfach mal gezeigt dass man bereit ist die sinnvollen Sweetspot taktraten um ein vielfaches zu übertreffen, bloß um so nah wie möglich an die Konkurrenz heran zu robben.
Ein 12900K mit MT Taktraten von 4,2-4,4Ghz auf den P-cores und 2,8-3Ghz auf den E-Cores wäre ähnlich effizient und performant in Mt workloads wie ein 5900x und in Spielen mit P-core Turbo über 5Ghz immer noch schneller. Dieses Produkt hat man aber nie geliefert, stattdessen hat man den 5950x angegriffen mit gemischtem Ergebnis und fast doppelter TDP.

Das ist insgesamt so viel effizienter.

Und langsamer. Wenn man die Taktraten der E-Cores reduziert gewinnt man zwar an Effizienz, aber dann sind +50% MT Leistung in weiter Ferne. Mit sinnvollen Taktraten für P und E Kerne sind eher +20-30% in Reichweite.

Schon ADL-S war nicht per se ineffizient. Ineffizient wurde es nur durch die sehr hohen Taktraten.

Lol ;D
Ein Produkt wird immer so gemessen und beurteilt wie es im Default- bzw. Auslieferungszustand ist, nicht übertaktet, nicht untertaktet oder getuned.

50% mehr Energie wären 361 Watt beim PL2. Du schreibst echt derben Stuss manchmal.

Habe ich nie geschrieben, du solltest vielleicht mal an deiner Lesekompetenz arbeiten anstatt Leute derbe zu beleidigen.
Ich habe was von nötigen +50% Perfomance geschrieben damit greymon55s Aussage aus der Tagesaktuellen news zutrifft. Dass du davon auf +50% Energie schließt einspricht einzig deinem wirren Kopf. Und 8 E-Cores verbrauchen aktuell bei 3,7Ghz ca. 50Watt (6W pro Core). Das kannst du gerne bezweifeln oder einfach bei Anandtech, cheese and chips, Computerbase. Dass diese benötigten 50Watt dann von dem Verbrauch der P-Cores und ggf. uncore abzuziehen sind versteht sich von selbst. Btw, PL2 liegt nicht immer an bei voller Core-Last, das heißt in nicht vektorisierten Workloads könnten die taktraten sehr wohl bei den 3,7-3,9Ghz bleiben. Von dem ganzen gedankenspiel muss man nun noch den Effizienzgewinn durch die µarch Veränderungen und Prozesstuning abziehen. Aber da das nur Cache ist und 12 Monate im Prozessdesign nicht viel bzw. 7nm bereits die optimierte Variante von 10SF ist, erhoffe ich mir da nicht viel.

Gipsel

2022-06-09, 13:27:13

Raptor Lake vs Zen 4 Performance-Vorhersagen (gemäß Hersteller-Folien):
https://www.3dcenter.org/news/news-des-8-juni-2022Da stellt sich die Frage, auf welcher Folie welches Herstellers bereits Vergleiche zur Performance der Notebook-Versionen auftauchen, wo doch noch nichtmal die SKUs der Desktop-Versionen von Zen4 festgelegt sind. Also ich würde dem noch nicht zu viel Gewicht beimessen, auch wenn es vielleicht ganz gute Tipps sind (aber eben wohl kaum mehr).

===========================

Für die Mobile Varianten soll auch noch

https://www.pcgameshardware.de/CPU-CPU-154106/News/Intel-Raptor-Lake-Effizienz-1383530/Ist wohl grob das Gleiche wie AMDs LDOs, die schon seit Jahren verbaut werden (edit: erstbester Link (https://www.hardwareluxx.de/index.php/artikel/hardware/prozessoren/44745-zen-und-vega-gemeinsam-amds-ryzen-apus-blasen-zum-angriff.html?start=1)). Erfüllt beides die exakt gleiche Funktion. AMD redet von "digital low-dropout regulator" (ein LDO ist eine Bauart eines linearen Spannungsreglers), Intel nennt es jetzt halt "digital linear voltage regulator". Super.

ryan

2022-06-09, 13:27:42

Wenn du damit mich meintest: Doch verstehe ich. Wusste ich nur nicht ;)

Das bezog sich auf davidzo.

Und langsamer. Wenn man die Taktraten der E-Cores reduziert gewinnt man zwar an Effizienz, aber dann sind +50% MT Leistung in weiter Ferne. Mit sinnvollen Taktraten für P und E Kerne sind eher +20-30% in Reichweite.

Es geht um die P-Kerne. Eine Takt Reduzierung der E-Kerne würde die Spannung nicht senken und würde somit kaum bis gar nichts bringen.

Lol ;D
Ein Produkt wird immer so gemessen und beurteilt wie es im Default- bzw. Auslieferungszustand ist, nicht übertaktet, nicht untertaktet.

Keiner hat etwas anderes behauptet, du verstehst nur den Zusammenhang mal wieder nicht.

BavarianRealist

2022-06-09, 13:34:37

Dass RaptorLake den Raphael in MT überbieten soll, daran zweifel ich sehr, denn:

Laut AMD sollen die Zen4-Kerne in 5nm in MT rund doppelt so effizient sein, wie die Zen3 in 7nm. Auch wenn es nicht mehr Kerne werden, so bräuchte dann Zen4 für die alte MT-Leistung nur noch 50%, also etwa max 70Watt (=70/16=4,4Watt/Core). Aber die neue TDP ist ja auch noch viel höher, also so bei 230Watt, womit dann grob 14Watt/Core blieben.

Dabei gilt zu bedenken, dass die Cores im Allcore-Boost quasi alle noch tief im eher effizienen Bereich takten, d.h. da bin ich schon gespannt, wieviel die jetzt im MT maximal höher takten können. Da dürfte noch sehr, sehr viel Luft nach oben sein. Und dabei sind die IPC-Verbesserungen noch nicht mit gerechnet, die im MT sogar noch höher als im ST ausfallen dürften, weil hier z.B. höhere Bandbreit durch DDR5 etc. Da könnten dann je nach Anwendung auch MT-Steigerungen zum Vorgänger von >+66% raus kommen. Lisa Su hat bezüglich MT vermutlich ähnlich untertrieben wie bei ST.

Im Gegensatz dazu ändert sich zwischen ADL und RPL nicht so viel, außer dass er ein paar mehr kleine Cores hat. Hier kommt es wohl eher auf die Verbesserungen innerhalb der kleinen Cores an.

Vor allem: wie glaubwürdig sind Vergleiche von Intel mit einem AMD-Produkt, das es noch nicht gibt???

Jedenfalls wird es sehr spannend!

ChaosTM

2022-06-09, 13:34:42

Für die Gamer könnte AMD dann im Zweifelsfall und falls es was bringt noch einen 3D nach schieben.
Welches System das beste P/L Verhältnis hat wird spanned und hängt neben dem Preis wohl stark von der Effizienz ab.

][immy

2022-06-09, 13:41:17

Nicht ganz realistisch. Die "echten" Cores wachsen nur um 50% an, die TDP dabei aber nicht im selben Maße. Und selbst wenn man die kleinen kerne weiter mit ineffizienten Taktraten wie über 3Ghz füttert wie beim 12900K, reicht das ganze wenn es hoch kommt für +30 - +40%. Nach den ersten Leaks schafft Zen4 in MT workloads gegenüber dem 12900K aber mehr als +40% mit 16T/32C.
Du vergisst aber, das Intel eventuell auch an der Effizienz der E-Cores geschraubt hat. So das es nicht nur mehr sind sondern auch die Performance etwas hoch geht. Eventuell Boosten die dann auch stärker im Desktop-Betrieb.

Bisher ging es intel häufig nur darum um Benchmarks zu gewinnen. Sonst hätte man auch keine 300W+ auf den 12er los gelassen. Das war ja schon krank. Und wie gesagt, die kleinen Kerne sind gar nicht mal so übel wenn es um ganz "normale" aufgaben geht. Nur wenn es speziell wird, können die halt nichts ausrichten oder werden langsam.

Außerdem darf man nicht vergessen, das dies Intels zweiter DDR5 Chip ist. AMD tut sich beim Speichercontroller eigentlich immer relativ schwer. Würde mich nicht wundern wenn Zen4 hier dank Probleme beim DDR5 Speicher noch deutlich zurückstecken muss.
Bei der Stromaufnahme sehe ich aber nach wie vor kein Land für Intel außer vielleicht im Laptop wo es fast nur auf die E-Cores ankommt. Intel hat hier mit den 12ern ein Terrain betreten ... da kommen die nur schwer wieder raus.

aufkrawall

2022-06-09, 14:23:57

[immy;13026347']
Außerdem darf man nicht vergessen, das dies Intels zweiter DDR5 Chip ist. AMD tut sich beim Speichercontroller eigentlich immer relativ schwer. Würde mich nicht wundern wenn Zen4 hier dank Probleme beim DDR5 Speicher noch deutlich zurückstecken muss.

Da tut sich AMD nicht (mehr) schwer mit, das 12nm I/O-Die von GlobalFoundries macht nur keine Taktrekorde mit. Ich sehe aber nicht, wie Intel da mit DDR5 im Vorteil wäre, denn auch bei Intel schmeißt man mit DDR5 viel IMC-Taktpotenzial weg.

Der_Korken

2022-06-09, 14:58:35

Nein, nicht in bezug auf die MT Leistung. Es sind aktuell 16 Cores und in Zukunft 24C. Also ein Zuwachs von +50% an Cores. Ich schrieb in dem Satz etwas von MT Leistung und da kann man die P-Cores nun schwerlich einfach ausblenden.

OK, das meintest du mit +50%. Damit sind +50% MT aber imho eh unrealisitsch, denn das würde ja implizieren, dass 8 zusätzliche E-Cores ca. 50% von dem leisten, was 8P+8E-Cores leisten, i.e. P-Cores und E-Cores sind in MT gleichschnell. Das stimmt aber nicht, da kann man inkl. SMT eher sagen 1 P-Core = 2 E-Cores. Insofern steigt der Core-Count in etwa von 24 E-Core-Äquivalent (2*8 + 8) auf 32 (2*8 + 16), also nur um 33%.

Unter der Annahme, dass Taktraten und IPC gleichbleiben natürlich. Da man die zusätzlichen Kerne im gleichen PPT unterbringen will, müsste der Takt also bei gleicher Effizienz der Kerne sinken statt steigen. Ich will nicht ausschließen, dass Intel da noch was optimiert wie AMD bei Zen 3+, aber eine Taktsteigerung ist schon arg unwahrscheinlich. Bliebe noch eine IPC-Steigerung, aber die wird wohl eher nicht bei durchgehend 13% liegen, die nötig wäre um von +33% auf +50% zu kommen.

Gratzner

2022-06-09, 15:12:03

[immy;13026347']Außerdem darf man nicht vergessen, das dies Intels zweiter DDR5 Chip ist. AMD tut sich beim Speichercontroller eigentlich immer relativ schwer.
Die Speichercontroller sind (außer bei intel) im wesentlichen zugekaufte IP von Cadence/Synopsys oder woher auch immer. Ich sehe da jetzt nicht das Problem für AMD (es sei denn, sie greifen auf nicht so gute IP zurück)

davidzo

2022-06-09, 15:15:20

Das bezog sich auf davidzo.

Wie wärs wenn du dich erstmal für deinen Lesefehler von 50% statt 50W entschuldigst wegen denen du anderen Leuten Stuss unterstellst.

Btw, falls du es noch nicht mitbekommen hast, ich finde die von dir gequoteten userbench 32% MT Uplift sind eine sehr realistische Einschätzung. Weitaus realistischer als die über 50% die greymon55 und einige andere Spekulanten verbreiten.

Laut AMD sollen die Zen4-Kerne in 5nm in MT rund doppelt so effizient sein, wie die Zen3 in 7nm.

Das ist irreführend, da das Modell und der Betriebspunkt unbekannt ist. Damit ist aber sicher nicht die Effizienz bei vollem MT-Turbo bei Topmodell vs Topmodell gemeint.
AMD hat ja nach den Blender Werten nochmal klargestellt dass die TDP / PPT der Spitzenmodelle von 105/142W beim 5950x auf 170/230W steigt.
Das bedeutet die per Core Power steigt bei einem 16kerner von knapp 6W auf gute 10Watt, bedenkt man das sparsamere 6nm i/o DIE sogar eher 12W.

Wenn man an diesem Betriebspunkt also doppelt so effizient sein will, dann wäre Zen nicht nur 46% schneller sondern müsste die vierfache performance abliefern (+300%).

Nee, solche Aussagen nützen gar nichts wenn nicht bekannt ist an welchem Punkt der Kurve man sich befindet.
Intel hat Alderlake beim Launch auch als 3,8x so Effizient dargestellt gegenüber Rocketlake. Wenn man RKL mit 250W betreibt und ADL mit 65W mag das ja stimmen und mit manuellen Eingriffen sogar nachstellbar sein, nur hat man die SKU halt nicht mit 16C/24T und 65W ausgeliefert und auch kaum einer betreibt sie so.

[immy;13026347']Du vergisst aber, das Intel eventuell auch an der Effizienz der E-Cores geschraubt hat. So das es nicht nur mehr sind sondern auch die Performance etwas hoch geht. Eventuell Boosten die dann auch stärker im Desktop-Betrieb.
Also jetzt doch mehr Takt für die E-Cores? Ich glaube kaum dass das im TDPbudget möglich ist wenn sich nun die doppelte Anzahl an Cores dasselbe Budget teilen. Das setzt ja eine 100% Effizienzsteigerung voraus. Bisschen viel für einen Node der eigentlich 10nm +++++ heißen würde.
Aktuell skalieren die E-Cores schon mit 3,7Ghz so schlecht dass es teilweise sinnvoller ist das zusätzliche TDP Budget den P-Cores zuzuschlagen. Die skalieren wenigstens noch. Da muss sich schon einiges an der µArch ändern damit sich Mehrtakt TDP-technisch wieder lohnt.

Gipsel

2022-06-09, 15:40:51

AMD hat ja nach den Blender Werten nochmal klargestellt dass die TDP / PPT der Spitzenmodelle von 105/142W beim 5950x auf 170/230W steigt.Es wurde auch gesagt, daß das Blender-Demo unterhalb von 170W lief. ;)

Mangel76

2022-06-09, 22:50:52

Es wurde auch gesagt, daß das Blender-Demo unterhalb von 170W lief. ;)

Ich dachte, die Aussage bezog sich nur auf den Sockel, nicht direkt auf Zen 4?

ceed

2022-06-10, 09:12:18

===========================

Ist wohl grob das Gleiche wie AMDs LDOs, die schon seit Jahren verbaut werden (edit: erstbester Link (https://www.hardwareluxx.de/index.php/artikel/hardware/prozessoren/44745-zen-und-vega-gemeinsam-amds-ryzen-apus-blasen-zum-angriff.html?start=1)). Erfüllt beides die exakt gleiche Funktion. AMD redet von "digital low-dropout regulator" (ein LDO ist eine Bauart eines linearen Spannungsreglers), Intel nennt es jetzt halt "digital linear voltage regulator". Super.

Im Artikel werden aber Stromeinsparungen von bis zu 25% (in bestimmten Betriebspunkten) genannt. Ob das AMD schon lange verbaut oder nicht spielt keine Rolle- die kann man ja 1:1 wieder in mehr Takt stecken und damit trotz gleicher Node und im Prinzip sehr ähnlicher Architektur n gutes Stück Effizienz raus quetschen im Vergleich zu Alder Lake.
Gesetz es bringt wirklich so viel wie beschrieben- was ich nicht wirklich glauben will.

aceCrasher

2022-06-24, 23:03:29

In XTU sind anscheinend neue OC Funktionen für Raptor Lake hinzugekommen, spezifisch:

- "Pro-Core OC-TVB"
- "Package OC-TVB"
- "Efficient TVB"

Letzteres soll laut Aussagen von Raichu potentiell Taktraten von bis zu 6GHz in einem stark selektieren Modell (KS?) ermöglichen. Persönlich kann ich mir unter dem Namen "Efficient Thermal Velocity Boost" noch nicht allzu viel vorstellen. Eventuell wie TVB aber für Teillast?

https://www.pcgameshardware.de/Intel-Core-Architektur-267419/News/OC-Funktionen-fuer-Raptor-Lake-Efficient-TVB-1397791/

ChaosTM

2022-06-24, 23:10:37

aceCrasher

2022-06-24, 23:20:51

Warum gehen jetzt auf einmal Taktraten von an die 6ghz? (ohne extreme Kühlung)

ich dachte man stieß schon beim Bulldozer an die Grenzen des machbaren - freut mich natürlich das zu sehen, solange man kein 400 watt braucht

Gute Frage - ich dachte auch lange dass wir bei ~5GHz eine Art Wand erreicht hätten und danach nicht mehr viel kommt. Dem scheint aber nicht so zu sein.

Ich persönlich tippe ja auf Verbesserungen in der Fertigung. Sieht man ja bei Zen 4, da sind plötzlich durch TSMC 5nm >10% Taktsprünge möglich.

Raptor Lake nutzt allerdings nur eine überarbeitete Version von Intel 7, also eigentlich den gleichen Prozess wie Alder Lake. Dieses Efficient TVB wird aber schon irgendeine Bedeutung haben, dass ein Raptor Lake Kern bei 100% Last 6GHz erreicht kann ich mir beim besten Willen nicht vorstellen.

Bei Raptor Lake kommt übrigens noch der DLVR hinzu, möglicherweise bringt der auch Vorteile was das angeht. So wie ich das verstehe ist dessen Zweck aber hauptsächlich eine Absenkung der Spannung bei Teillast.

https://videocardz.com/newz/intel-raptor-lakes-digital-linear-voltage-regulator-dlvr-could-reduce-cpu-power-up-to-25

Zossel

2022-06-25, 08:31:49

Ist wohl grob das Gleiche wie AMDs LDOs, die schon seit Jahren verbaut werden (edit: erstbester Link (https://www.hardwareluxx.de/index.php/artikel/hardware/prozessoren/44745-zen-und-vega-gemeinsam-amds-ryzen-apus-blasen-zum-angriff.html?start=1)). Erfüllt beides die exakt gleiche Funktion. AMD redet von "digital low-dropout regulator" (ein LDO ist eine Bauart eines linearen Spannungsreglers), Intel nennt es jetzt halt "digital linear voltage regulator". Super.

In dem Patent ist auch die Rede von "FIVR", diesen Begriff hat Intel früher mal für Schaltregler (kein Längsregler) verwendet die auf dem Die integriert waren. Die Frequenz von dem Ding war hoch genug um passende Induktivitäten auf das Die ätzen zu können.

davidzo

2022-06-25, 14:40:51

FIVR ist eine on and off Beziehung für Intel.

Die voltage regulators auf dem DIE zu integrieren bedeutet halt zusätzliche Abwärme an einer Stelle die ohnehin schwer zu kühlen ist und es gibt halt nur ein Design pro DIE. Das skaliert nicht besonders mit den SKUs.
Es ist nicht so als wenn Haswell irgendwie Probleme mit der Taktrate hatte wegen FIVR. Aber nach Haswell ging es wohl bergab mit FIVR.

Skylake, die langweiligste und rückwärtsgewandteste aller CPU Architekturen hat deswegen FIVR wieder zurückgerollt, dabei war es bei Haswell und Broadwell sehr erfolgreich. Bei den kleinen Broadwell DIEs ohne Iris pro war es zuerst ein problem mit der thermischen Dichte, aber da sind wir mittlerweile eh weit drüber hinweg. Die Rede war damals schon von 3Watt Prozessoren in 14nm. Schade dass Intel das alles aufgegeben hat.
Sie haben es mit Icelake nochmal versucht, aber auch für Rocketlake wieder zurückgrollt.
Es erfordert anscheinend einiges vom Prozess ab, weshalb Intel es für die Hochtaktmodellen von Cometlake, Rocketlake und Alderlake kein FIVR verwendet. Vielleicht rührten daher die Probleme bei Icelake mit der Taktbarkeit?

DLVR könnte der nächste Anlauf sein. Eine Kombination von FIVR und klassischem VRM auf dem PCB. Ersteres für Teillast und idle, letzteres auf dem mainboard für maximale Leistung und bessere Skalier- und Kühlbarkeit.

Locuza

2022-06-25, 15:15:37

Intel werkelt die ganze Zeit an der Implementierung von FIVRs und verwendet sie bis Heute.
Bis einschließlich dem kommenden Sapphire Rapids verwenden die Server-Chips FIVRs für die CPU-Cores.
Im Client-Bereich hat es ebenso Ice Lake und Tiger Lake 4C/8C getan, letzterer hat auch um die 5 GHz erreicht.
Alder Lake verwendet auch FIVRs, allerdings nicht mehr für die CPU-Cores, aber für andere Komponenten wie den System Agent, DDR I/O, Display I/O und restliches Zeug.

Gipsel

2022-06-26, 10:47:46

In dem Patent ist auch die Rede von "FIVR", diesen Begriff hat Intel früher mal für Schaltregler (kein Längsregler) verwendet die auf dem Die integriert waren. Die Frequenz von dem Ding war hoch genug um passende Induktivitäten auf das Die ätzen zu können.Ja, aber im Patent geht es explizit um Linearregler, nicht um schaltregelnde FIVR (die stehen nur als Beispiel für bereits Existierendes drin, nicht als etwas neu Patentiertes). Die neuen on-Die Linearregler sollen nach intel anders verschaltet werden als die (seriellen) LDOs von AMD (und so ein paar potentielle Probleme umgehen und dabei vermutlich andere kreieren). Die Auslegung von AMD's LDOs limitiert im Prinzip die maximale Stromaufnahme eines Kerns, größere maximale Stromaufnahme erfordert größere LDOs. AMD spart Leistungsaufnahme bei mittleren und niedrigen Lasten, aber im Peak bei Vollauslastung kommt durch die LDOs ein wenig was dazu (zumindest auf Kernebene, wenn nur ein Kern im Boost ist und der Rest idle, könnte man insgesamt immer noch sparen; worst case für AMDs LDOs ist hoher Allcore-Boost und maximale Stromaufnahme auf allen Kernen).
Aber am Ende geht es beiden Lösungen wohl schlicht darum, daß man die Spannung bei geringen Lasten schnell absenken kann und so Effizienz gewinnt (und das ist wie man bei AMD sieht auch locker pro Core durchführbar [mit limitiertem Spread der Spannungen zwischen den Kernen, intel spricht im Patent von 160mV]). Die Vor- und Nachteile an verschiedenen Betriebspunkten dürften unterschiedlich ausfallen (bei Volllast könnte intels Lösung besser sein [insbesondere wenn die Kerne sehr viel Strom ziehen], im Teillast oder idle sollten AMDs LDOs Vorteile haben [die als Nebeneffekt auch gleich den ganzen Kern powergaten können, das geht bei der Verschaltung in intels Patent nicht]).

Edit:
Bei Lesen des Patents kommt es mir so vor, als würde intel zuerst mal hauptsächlich darauf zielen, quasi die Margen für Transienten einzusparen (die werden von dem zweiten Mainboard-Spannungsregler abgedeckt), so daß die Hauptversorgungsspannung für die CPU abgesenkt werden kann.

Nightspider

2022-06-26, 14:27:13

Hatte AMD jetzt die überlegene Spannungsversorgung innerhalb des Prozessors die letzten Jahre?

Wenn ja seit welcher Generation?

Bei Rembrandt hat sich ja nochmal viel getan. Wahrscheinlich muss man sich da durch viele Patente quälen um einen Überblick zu haben wie viele (hunderte?) winzige Designentscheidungen in vers. Situationen die Leistungsaufnahme verbessern.

Wuge

2022-06-26, 16:52:53

Überlegen ist auch immer relativ, es ist immer ein Kompromiss vor allem im Hinblick auf Komplexität.
Alder Lake verstehe ich in der Hinsicht allerdings überhaupt nicht. Man hat schon 3 Rails in die CPU implementiert und hängt dann die drei größten Energieverbraucher, die noch dazu individuell takten (P, E und Cache) auf eine gemeinsame Rail. Das ist natürlich bullshit. Die E Cores gehören hinter FIVR, damit man unter Vollast effizient fahren kann während der favorite P Core meinetwegen mit 1.5V rennt. Das würde nicht nur Strom sparen sondern in throtteling Zuständen (Power/Hitze) wohl auch Leistung bringen. Aber man hat wohl die Komplexität gescheut oder braucht die Spannung für den Interconnect der Atom-Cluster an den Ring sowieso....

dildo4u

2022-07-05, 13:20:25

Leak zum Z790 Chipsatz.

https://www.computerbase.de/2022-07/intel-raptor-lake-s-blockdiagramm-zeigt-die-wichtigsten-neuen-features/

HOT

2022-07-05, 15:41:08

Hm, Stagnation.

KarlKastor

2022-07-05, 18:31:07

Ein bisschen mehr USB 20G und PCIe 4.0.
Was soll da sonst kommen? Der wurde ja erst extrem aufgebohrt.
Bei der CPU hätte man vier weitere PCIe 5.0 Lanes erwarten können.

BlacKi

2022-07-05, 19:23:02

war nicht 1 slot mit pcie5.0 m.2 slot angekündigt?

Nightspider

2022-07-05, 20:07:23

Ist schon bekannt, was genau AI M.2 machen oder bringen soll?

-=Popeye=-

2022-07-05, 20:17:43

Das Hailo-8™ M.2-Modul ist ein Beschleunigungsmodul für KI-Anwendungen und entspricht dem Formfaktor NGFF M.2. Das Modul basiert auf dem Prozessor Hailo-8™, der 26 TOPS (Tera-Operationen pro Sekunde) leistet und das bei einer sehr hohen Leistungseffizienz von 3 TOPS/W. Das M.2-Modul verfügt über eine vollständige PCIe Gen-3.0 4-Lane-Schnittstelle und bietet eine bislang unerreichte KI-Leistung für Edge-Geräte. Das M.2-Modul kann in ein vorhandenes Edge-Gerät mit M.2-Sockel eingesteckt werden und dann in Echtzeit und mit geringem Stromverbrauch Inferenzen in tiefen Neuronalen Netzwerken durchführen. Anwendungen dafür sind in vielen Marktsegmenten zu finden. Durch Nutzung des umfangreichen Hailo Data Flow Compilers und die Unterstützung von Standard-KI-Frameworks können Kunden ihre Neuronalen Netzwerkmodelle einfach auf den Hailo-8™ portieren und so sehr leistungsfähige KI-Produkte schnell auf den Markt bringen.

https://hailo.ai/de/products/hailo-8-m-2-ki-beschleunigungsmodul/#overview

Nightspider

2022-07-05, 20:20:00

Danke.

Also für die meisten Leute uninteressant.

HOT

2022-07-05, 20:43:38

war nicht 1 slot mit pcie5.0 m.2 slot angekündigt?
Intel hat jetzt offizell gemacht, dass man zulasten 8 PEG-Lanes 2 m.2 anschließen kann, das ist alles.

2022-07-05, 23:24:55

Warum gehen jetzt auf einmal Taktraten von an die 6ghz? (ohne extreme Kühlung)
Frequenzen sind nicht so trivial zwischen verschiedenen Architekturen vergleichbar, es ist auch eine Designentscheidung. Kleinere Prozesse ermöglichen schnellere Transistorschaltzeiten, aber du kannst statt die Frequenz zu steigern, tiefere Schaltungen basteln oder einzelne mit weniger Saft betreiben und dadurch mehr Transistoren insgesammt verbauen. Mehr Takt ist im Prinzip ineffizienter wenn man nur eine Schaltung betrachtet, aber da jede Schaltung einen anderen Takt aushalten kann, gibt es viele Möglichkeiten den Takt anzusetzen, entsprechend muss man alle Schaltungen dann anpassen.

Deswegen glaube ich ist eine Steigerung von 5GHz auf 6GHz eher eine Entscheidung.

Wuge

2022-07-06, 10:55:15

Naja, die Architektur ist quasi unverändert und der Prozess wohl auch. So eine Art neues Stepping würde man sagen. 10% mehr Takt ist da schon ne Ansage. Die aktuellen CPUs gehen schon bis 5.5 Ghz bei Teillast aber auch mit ordentlich VCore.

dildo4u

2022-07-06, 11:10:52

Komplett nutzlos interessant ist was passiert wenn du 4 Core belasttet oder was für ein Argument hat eine 300Watt Webbrowser CPU?
Deshalb hat AMD 5.5Ghz unter Gameing demonstriert.

Wuge

2022-07-06, 17:12:45

mocad_tom

2022-07-06, 18:23:49

Ich hab in meinen relevanten Usecases (DCS und FS2020) jeweils 5.5 Ghz auf den Favorite Cores anliegen und selten drops auf 5.4 Ghz. Passt schon. Gibt genug Software die leider nicht mit mehr Kernen skaliert. Wattage hält sich auch in Grenzen, 80-120W etwa.

Beim Sprung von Alderlake auf Raptorlake darf man aber auch nicht vergessen, dass die L2-Cache-Pipeline jetzt wohl so ziemlich direkt von Sapphire Rapids übernommen wurde. Desweiteren ist der Ringbus an sich höher getaktet, weil die Gracemont-Cores auch höher getaktet werden können. CinebenchScore geht deshalb ab wie Schmidts Katze, weil das workingset jetzt auch in den L2 von Gracemont reinpasst. Und weil der IMC jetzt auch andere Datenraten verträgt ist die anbindung Ringbus zu IMC stärker.

Wuge

2022-07-07, 10:53:29

Joa... wenn da in Games 5-6% durch Cache und Speicher + noch mal 5-8% durch mehr Takt ankommen freu ich mich schon drauf - auch wenn die Mehrkerne nicht interessant sind.

Leonidas

2022-07-14, 09:07:32

China-Preview des 13900K mit Benchmarks:
https://www.bilibili.com/video/BV1La411H7NU

https://pbs.twimg.com/media/FXjcevgWIAAZsaq.png

HOT

2022-07-14, 09:10:06

Hö? Ist im Gunde doch nur ein KS mit mehr E-Kernen, ich glaub ihr erwartet zuviel davon. Und der L3 der E-Kerne wird nach wie vor langsam sein.

aceCrasher

2022-07-14, 10:32:17

Hö? Ist im Gunde doch nur ein KS mit mehr E-Kernen, ich glaub ihr erwartet zuviel davon. Und der L3 der E-Kerne wird nach wie vor langsam sein.

...und doppelt so viel L2 sowie einem besseren IMC.

davidzo

2022-07-14, 11:01:34

Gutes Review.

+10% ST übertrifft meine Erwartungen. Und das rein über den Takt. - Hätte nicht gedacht das Intel das aus dem alten 10nm Prozess noch herausholen kann ohne dass der verbrauch erneut explodiert, ist der doch jetzt am Ende seiner Entwicklung.
Mal abwarten ob das auf games übertragbar ist. Ich würde eher erwarten dass die Server Cache Konfiguration von SR->RTL in Games etwas schlechtere Latenzen hat und auch die zusätzlichen Stops für das Mehr an E-cores weiter die Latenzen erhöhen. Die SR leaked Benchmarks waren von den Cache- und Speicherlatenzen jedenfalls katastrophal und wesentlich schlechter für spiele als die ADL konfiguration.

+40% MT liegt im oberen Bereich der Erwartungen durch +50% mehr E-Cores und auch bitter nötig wenn man den Vorsprung sieht den bereits Zen3 mit 16C vor Alderlake hat. Dass man den E-Core Takt erhöht hat wundert mich. Die takteten bisher weit außerhalb des sweetspots und waren bei 3,9Ghz schon weniger Effizient als die P-Cores. Hätte gedacht dass man den Takt hier eher runterschraubt wenn man einfach mehr Cores verbaut. Die sind ja flächenmäßig ziemlich billig, insofern sollte sich der tradeoff für mehr MT Leistung eigentlich lohnen.

HOT

2022-07-14, 14:03:38

Bei einigen Anwendungen bringt der L2$ schon einiges, bei Spielen hab ich da auch meine Zweifel.
Schön ist, dass man doch recht stark an der Effizienz schrauben konnte, sieht etwas weniger desaströs aus als bei ADL, wenngleich der Verbrauch weiterhin sehr hoch bleibt.

ryan

2022-07-15, 17:38:22

Updated video shows AIDA FPU stress test.
Policy set to Intel Specification in BIOS (infinite 253W PL2)
22°C ambient, 77°C Package Temp after 25 minutes at 253W with a 360mm AIO.
https://twitter.com/SkyJuice60/status/1547940989234741249/photo/1

5100-5200 Mhz P-cores und 4000-4100 Mhz E-cores im AIDA FPU Stresstest bei 253W PL2. Die Spannung liegt bei 1,27V.

Thunder99

2022-07-15, 19:28:42

Intel kann weiterhin nur Speed mit massiver Leistungsaufnahme...

dildo4u

2022-07-15, 19:51:36

Die 300€ Modelle sind dort ok, nichts da drüber macht Sinn fürs Zocken.
Nur bei AMD wirst du mehr für V-Cache Modelle zahlen.

ryan

2022-07-15, 21:26:12

Intel kann weiterhin nur Speed mit massiver Leistungsaufnahme...

AMD geht auf 230W obwohl sie einen fullnode besser dran sind, das ist nicht gerade rühmlich.

Der PL2 steigert sich nur leicht von 241W auf 253W. Dabei bringt Intel 8 zusätzliche E-Kerne unter. Wenn man sich die AIDA FPU Taktraten ansieht, zusätzlich noch mit mehr Takt - die Effizienz steigt deutlich.

Das ist schon beachtlich, was Intel aus dem alten Prozess und Golden Cove refresh rausholen kann. Raptor Lake ist das, was Alder Lake von Anfang an hätte sein müssen. Das wäre eine Granate gewesen.

MSABK

2022-07-15, 22:39:54

Linmoum

2022-07-15, 22:45:19

Der Kritikpunkt war und ist auch nie der absolute Verbrauch, sondern die aus dem Verbrauch resultierende Leistung.

Wenn Faildozer damals die Intels hätte Staub fressen lassen, hätte sich auch niemand über den in Relation absurd hohen Verbrauch beschwert. Wenn man aber deutlich mehr säuft und dabei auch noch deutlich lahmer ist, dann ist das einfach schlicht desaströs.

y33H@

2022-07-16, 00:06:21

Wir wissen ja noch nichts über den realen Verbrauch bei Zen4.Die 230W gibt's sicherlich nicht umsonst, gerade bei 12C und 16C.

bbott

2022-07-16, 01:29:28

Die 230W gibt's sicherlich nicht umsonst, gerade bei 12C und 16C.
Reserve für 3D oder Zen5?!
Der Ryzen R7 7950X soll wohl weniger als 170W ziehen, lt. AMD.

KarlKastor

2022-07-16, 05:18:19

AMD will halt diesmal vermeiden, dass Intel mit der Brechstange vorbei zieht. Da man CPUs sehr einfach auch in der TDP begrenzen kann, kann mir das egal sein, wie die Default aussehen.

Linmoum

2022-07-16, 06:23:25

Die 230W gibt's sicherlich nicht umsonst, gerade bei 12C und 16C.Ich hätte grundsätzlich eher gesagt gerade für mehr als 16C. Da ist das nämlich sinnvoll statt ein Mehr an Kernen künstlich zu limitieren und IMO bleibt es auf diesem Sockel auch nicht bei 16C.

Intel wird nach RTL wieder den Sockel wechseln, bei AMD gehe ich wieder von 1-2 Gens mehr aus.

Gipsel

2022-07-16, 17:04:16

Reserve für 3D oder Zen5?!
Der Ryzen R7 7950X soll wohl weniger als 170W ziehen, lt. AMD.Nicht ganz. Das 16C-Zen4 Sample in der Blender-Demonstration, was 46% schneller war als ein 12900K(?), lief unter 170W. Es wurde aber gesagt, daß die Specs noch nicht feststehen. Was die finale Version nachher ziehen wird, ist also noch unbekannt. Eventuell führt AMD ja eine zusätzliche TDP-Klasse ein. Man hat die bekannten 65/105W TDP (88/142W PPT) in denen die normalen X und non-X Versionen einsortiert werden, aber obendrauf gibt es eben auch noch einen 7950XT als Top-Modell mit höherem allcore-Takt oder so. Wir wissen es noch nicht.
Genauso wissen wir noch nicht, ob man wirklich sofort das Sockellimit von 170W TDP / 230W PPT ausschöpfen wird (oder wie von Dir vorgeschlagen das z.B. erst mit einer 24C-Version von Zen5 tut) oder noch eine TDP-Klasse bei 125W (170W PPT) als nominales TDP-Äquivalent zu den intel-CPUs einführt (die CPU aus dem Blender-Demo war offenbar so konfiguriert, was aber wie gesagt nicht viel heißen muß).

Nightspider

2022-07-16, 17:31:44

Für uns Konsumenten und die Endpreise ist es eh gut, wenn beide Kontrahenten sich ein enges Kopf an Kopf Rennen leisten.

Die Gaming und Anwendungsleistung wird vielleicht keine 10% auseinanderliegen zwischen Raptorlake und Zen4.

Zen4 mit V-Cache wird dann natürlich in Games merklich vor Intel liegen.

Nazar

2022-07-16, 18:03:48

AMD geht auf 230W obwohl sie einen fullnode besser dran sind, das ist nicht gerade rühmlich.

Der PL2 steigert sich nur leicht von 241W auf 253W. Dabei bringt Intel 8 zusätzliche E-Kerne unter. Wenn man sich die AIDA FPU Taktraten ansieht, zusätzlich noch mit mehr Takt - die Effizienz steigt deutlich.

Das ist schon beachtlich, was Intel aus dem alten Prozess und Golden Cove refresh rausholen kann. Raptor Lake ist das, was Alder Lake von Anfang an hätte sein müssen. Das wäre eine Granate gewesen.

Hilfloser Versuch einer Relativierung.

1. Vergleich von Äpfel mit Birnen (Sockel-Power gegen echten Verbrauch).
2. Von Zen4 sind weder die Leistungsdaten noch irgendwelche Benchmarks bekannt.
3. Das, was von den offiziellen Seiten herausgegeben wurde, wird (absichtlich?) von vielen "Experten" falsch interpretiert und besonders in Mathe/Physik scheinen einige gepennt zu haben (>). :rolleyes:

ryan

2022-07-16, 18:46:21

Hilfloser Versuch einer Relativierung.

Die Relativierung von AMDs 230W oder der Relativierung der gesteigerten Effizienz?

1. Vergleich von Äpfel mit Birnen (Sockel-Power gegen echten Verbrauch).

Wo vergleiche ich das? Was ist der Sockel Verbrauch und was der echte? Du meinst 230W PPT und 253W PL2 ist ein Äpfel Birnen Vergleich?

2. Von Zen4 sind weder die Leistungsdaten noch irgendwelche Benchmarks bekannt.

Und weiter? Von Raptor Lake habe ich auch noch nichts finales gesehen. Es sieht nicht so aus, als wenn Zen 4 16C wirklich schneller wäre. ST eher das Gegenteil, da wird es schwer gegen Raptor Lake. Und im Multithread wird es Zen 4 16C nicht leicht haben deutlich vorne zu liegen aufgrund der doch deutlich gesteigerten MT Leistung von Raptor Lake.

AMD muss bei Zen 4 mehr ans Taktlimit gehen, was die Effizienz drückt. Bei der Effizienz nähert sich AMD an Intel an, was in Anbetracht eines fullnode Vorsprungs kein Glanzstück ist. Das muss man nüchtern betrachtet einfach mal so sagen. Du kannst gerne die hohe PL2 von Intel kritisieren, kein Problem.

Jetzt aber wo AMD das power target auch nach oben hin öffnet, um konkurrenzfähig zu bleiben, zieht das einseitige Gebashe nicht mehr. Genau das versuchst du zu relativieren, das sieht mir schon eher nach einem hilflosen Versuch aus.

reaperrr

2022-07-17, 15:37:15

Bei der Effizienz nähert sich AMD an Intel an, was in Anbetracht eines fullnode Vorsprungs kein Glanzstück ist.
Welcher FullNode-Vorsprung?

Intel7 ist ca. auf dem Niveau von N7, bei SRAM wohl eher auf dem Niveau von N5 (Zen2/3 sind nur deshalb kleiner als GC, weil Intel für die etwas höhere Leistung MASSIV mehr Transistoren aufwenden muss), und N5 ist objektiv betrachtet bestenfalls ein HalfNode-Sprung (die nur bis zu 30% mehr Packdichte beim SRAM ggü. N7 reichen wahrscheinlich gerade so, um die Verdopplung des L2 bei Zen4 flächenmäßig auszugleichen).
Auch elektrisch ist der Vorteil von N5 ggü. N7 zwar OK, aber nicht berauschend.

Der PL2 steigert sich nur leicht von 241W auf 253W. Dabei bringt Intel 8 zusätzliche E-Kerne unter. Wenn man sich die AIDA FPU Taktraten ansieht, zusätzlich noch mit mehr Takt - die Effizienz steigt deutlich.
Am oberen Ende des PL2, wo es mit Luftkühlungen schwer wird... super.

In normalen Lastszenarien sieht es dann aber wohl eher so aus:
https://wccftech.com/intel-core-i9-13900k-raptor-lake-vs-core-i9-12900k-alder-lake-gaming-synthetic-performance-benchmarks-leak/
One interesting comparison that has been made is the power consumption figures where the Intel Core i9-13900K consumes up to 52% higher in games than the Core i9-12900K and an average of 20% higher power consumption across all three resolutions tested. This means that the next-gen Raptor Lake CPU lineup is going to be more power-hungry than Alder Lake, even in games.
Erkläre mal, wo bei bis zu 52% mehr Saft für satte 5% mehr Gaming-Leistung die Effizienzsteigerung ist ;)

Kriegsgeier

2022-07-17, 19:38:17

y33H@

2022-07-17, 20:05:46

Da steht Peak, nicht Average ... weird.

Der_Korken

2022-07-17, 20:12:03

Eine Frage an die Experten hier in der Runde:

ist es möglich oder gar wahrscheinlich, dass die Leistung der E-Cores vom 13900K in jeder Disziplin besser ausfällt als die der konventionellen Kernen des 8700K z.B.
Habe nämlich den 8700k immer noch...

Danke für die Antwort

Kommt drauf an, was du mit "E-Cores" meinst. Wenn du alle E-Core nimmst - also 16 an der Zahl - werden die in multithreaded Anwendungen Kreise um einen 8700K ziehen. Wenn du Core vs Core vergleichst, dann könnte eher der 8700K die meisten Disziplinen für sich entscheiden: Die E-Cores haben kein SMT, d.h. 6 E-Cores haben nur 6 Threads statt 12. Die E-Cores werden vermutlich nur knapp über 4Ghz takten, sodass ich den 8700K in singlethreaded vorne sehe. Und in Spielen waren die E-Cores bisher relativ lahm, weil die Speicher- und L3-Latenzen deutlich schlechter als bei den P-Cores waren.

Da man E-Cores aber nicht ohne P-Cores kaufen oder betreiben kann, ist das aber ein eher akademischer Vergleich. Sobald du 2 P-Cores dazu nimmst, gewinnen diese gegen den 8700K alle ST-Benchmarks und ich würde sogar behaupten, dass die meisten Spiele mit dieser Kombo schneller laufen, weil die sicher nicht volle Leistung auf allen benutzten Threads brauchen, sondern es eher ein oder zwei dominante Haupt-Threads gibt, die viel ST-Leistung und Cache brauchen, während die Neben-Threads sich auch mit den E-Cores zufrieden geben.