PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Performancegewinn SingleThread durch Sixcore (L3 Cache)


PacmanX100
2017-03-07, 15:19:40
Mich würde mal interessieren, abseits der für mich uninteressanten MultiThread Performance, wie groß der Leistungsvorteil in den genannten Fällen ausschaut:

Die Anwendung beansprucht meist nur einen Kern
Sie läuft auf einem 6 oder 8-Kerner.

Insbesondere ist der L3 Cache bei vielen CPUs das Bindeglied zwischen allen Cores. Wie schaut es also aus, wenn die meisten Cores idlen und theoretisch 15, 20, 25MB L3 Cache zur Verfügung stehen?
In vielen Benchmarks fällt ja schon auf das selbst ein 5820k oftmals sehr nahe oder sogar vor einem viel schnelleren 4790k kommt.

Wie zuletzt Broadwell und Penryn gezeigt haben reagieren Anwendungen sehr positiv auf einen dicken Cache. Hat sich irgendeine Seite dieser Sache mal angenommen? Leider sind die meisten Anwendungen keine Benchmarktitel.
Fussballmanager, Strategietitel der alten Schule, MMOs... Emulatoren.

Daredevil
2017-03-07, 15:27:35
Das liegt aber auch an den unterschiedlichen Boost stufen.
Ein 4xxxk boostet SingleCore vermutlich auch ganz anders als ein 5xxxk.

Mein x5650 boostet mit allen 6 auf 4.2Ghz, mit 4 auf 4.5Ghz, mit 1 Kern auf 4.9Ghz.

Nur steht bei jedem Test nun mal auch nicht dabei, wieviel GHZ dort anlagen, wenn es nur 1 oder 2 Kerne gebraucht hat. Also mal abgesehen von dem Cache natürlich könnte das auch eine Erklärung sein.

PacmanX100
2017-03-07, 15:43:54
Biste da wirklich sicher? Die MultiCores haben in der Regel einen deutlich geringeren Boostmodus. Laut Spezifikation darf ein 5820k maximal 3.6 GHz boosten, der 4790k maximal 4.4 GHz. Und schon das sind satte 800MHz differenz die er öfters mal wegmacht.

Achill
2017-03-07, 17:03:56
Biste da wirklich sicher? Die MultiCores haben in der Regel einen deutlich geringeren Boostmodus. Laut Spezifikation darf ein 5820k maximal 3.6 GHz boosten, der 4790k maximal 4.4 GHz. Und schon das sind satte 800MHz differenz die er öfters mal wegmacht.

Weder mein alter 5820k noch mein aktueller 6850k boosten so hoch per Default. Mein Asus-Board hatte eine Einstellung, dass der Single-Boost auf alle Cores ausgedehnt wird, aber alles andere war immer OC (wie schon der Boost für alle Cores).

Daredevil
2017-03-07, 17:10:35
Achso ja, bei mir ist das natürlich OC.
Aber nichtsdestotrotz boosten verschiedene i7 Generationen bestimmt unterschiedlich anders bei SingleCore Anwendungen?!
Also ein 6Core 6nd Gen und ein 8Core 7nd Gen.

PacmanX100
2017-03-07, 17:22:58
Also eigentlich sollten die nicht höher boosten als das was Intel sagt. Alles andere wäre ein BIOS bug. ;)
Der 5820k hat ja 3.3 Basis, deswegen ist 3.6 GHz schon der Turbo und der geht sogar noch runter wenn alle Kerne gleichzeitig am Anschlag laufen.

Weder mein alter 5820k noch mein aktueller 6850k boosten so hoch per Default. Mein Asus-Board hatte eine Einstellung, dass der Single-Boost auf alle Cores ausgedehnt wird, aber alles andere war immer OC (wie schon der Boost für alle Cores).

Teste es mal mit 7zip Benchmark. Bei 1Thread müsste er hoch gehen, bei 6, 8, 12 immer niedriger. Die BIOS Funktion ist schon OC auch wenn der meistens funktioniert. So oder so, es gibt wie gesagt Fälle wo ein ein 800 MHz niedriger Prozessor trotzdem schneller läuft. Das ist schon ganz beachtlich, insbesondere wenn man vor der frage steht ob 4.6 GHz 4-Kern oder 4.2 GHz 6-8Kern. Meist ist es genau dazwischen wo das Limit aufkommt. ;)

qiller
2017-03-07, 23:50:01
Mein x5650 boostet mit allen 6 auf 4.2Ghz, mit 4 auf 4.5Ghz, mit 1 Kern auf 4.9Ghz.
Ein alter Nehalem 6-Kern Xeon mit Default 3GHz läuft auf 4.9GHz stabil :eek:? Sportlich :up:

basix
2017-04-05, 12:26:40
Die Fragestellung ist durchaus interessant. Die Beobachtung konnte man gleich nach erscheinen des 5820K schon machen. Eigentlich müsste man einen pro Takt Vergleich zwischen 4790K und 5820K raussuchen und beim 5820K zwei Kerne deaktivieren. Wenn jemand mit einem entsprechenden 4-Core Haswell (egal welches Modell) testet kann ich gerne ein paar Resultate mit dem 5820K liefern.


Fixed Core Clock
Fixed Cache Clock
4 aktive Cores ohne SMT
Optional: 5820K mit nur 2-Channel Memory


Die Frage ist, ob beim Cache was deaktiviert wird, wenn nur 4 Cores aktiv sind.

Master of Puppetz
2017-04-05, 17:47:59
Die Frage ist, ob beim Cache was deaktiviert wird, wenn nur 4 Cores aktiv sind.

Der L3 Cache bei den Intels ist ja inklusiv, also liegt der Inhalt der L2 immer auch im L3.
Da würde mich mal interessieren, was bei Abschaltung von Kernen passiert.
Wird dann der Platz trotzdem reserviert? Oder wird sowieso immer nur die tatsächlich vorhandene Datenmenge der L2 Caches in den L3 gelegt, also auch mal nur 128kb pro Core?
Viel macht es aber auch nicht aus. Beim Vierkerner stünden 7,75MB statt 7MB zur Verfügung, beim 8 Kerner mit 25MB wären es 24,75MB statt 23MB.

edit: Damit meine ich natürlich den Cache für Singlethread Nutzung.

PacmanX100
2017-04-06, 09:40:06
Genau das wäre meine Frage. Wenn nur (wie so oft) bei alten Anwendungen die 1-3 Cores genutzt werden, ist der Cache dann voll aktiv? Das würde ja eine immense Steigerung bedeuten. 15MB für die eine Anwendung zur Verfügung.
Vorstellbar ist natürlich auch das ungenutzte Teilbereiche abgeschaltet sind. Allerdings erklärt das dann nicht die Vorteile in diversen Benchmarks wo die niedrigen Modelle ganz oben rangieren. ;)

basix
2017-04-06, 18:25:51
Genau das wäre meine Frage. Wenn nur (wie so oft) bei alten Anwendungen die 1-3 Cores genutzt werden, ist der Cache dann voll aktiv? Das würde ja eine immense Steigerung bedeuten. 15MB für die eine Anwendung zur Verfügung.
Vorstellbar ist natürlich auch das ungenutzte Teilbereiche abgeschaltet sind. Allerdings erklärt das dann nicht die Vorteile in diversen Benchmarks wo die niedrigen Modelle ganz oben rangieren. ;)

Wenn alle 6 Cores aktiv sind, ist der ganze L3 aktiv auch wenn nur 1 Core belastet ist. Theoretisch könnte die Anwendung den ganzen Cache verwenden. Evtl. schaltet die CPU aber noch bei z.B. nur 5MB Belegung ein paar L3-Slices ab. Keine Ahnung. Bezüglich IPC sieht man anhand folgendem Beispiel eine Steigerung:

Cinebench R15
6950X @ 4.40GHz = 199 Punkte
6900K @ 4.50GHz = 204 Punkte
7700K @ 4.50GHz = 192 Punkte
7700K @ 4.75GHz = 211 Punkte

http://www.realhardwarereviews.com/clash-of-the-titans-amd-ryzen-r7-vs-intel-6950x-6900k-7700k/9/

Und dies obwohl Kabylake eine 5-10% höhere IPC als Broadwell haben sollte. Die obigen Werte sind nicht ganz konsistent, wenn man die Taktraten usw. auf Punkte umrechnet. Wahrscheinlich lagen beim 7700K nur 4.4GHz an. Trotzdem kommt noch eine höhere IPC für Broadwell-E heraus. Es kommt aber auf die Anwendung an (bei POV Ray sehe ich keinen IPC Vorteil)

IceKillFX57
2017-04-09, 22:28:36
Also ich hätte einen 4790K zum testen...Müsstet mir nur die Settings vorgeben.

Der macht bis zu 4.90GHz auf allen Kernen mit HT mit.

Sonst noch einen alten i7-860 2.80GHz der bis zu 4.20GHz mit HT macht.

PacmanX100
2017-04-10, 00:36:07
Ja wie wäre es mit 7zip (32MB, 2 Threads) und SuperPI?
Lass das mal durchlaufen. Ein paar alte 3DMarks (nur CPU Score) wäre auch nicht schlecht um mal zu vergleichen.
Speicherwerte aber mit angeben weil sonst is das schlecht zu vergleichen :)

IchoTolot
2017-04-13, 20:13:02
Und dies obwohl Kabylake eine 5-10% höhere IPC als Broadwell haben sollte. Die obigen Werte sind nicht ganz konsistent, wenn man die Taktraten usw. auf Punkte umrechnet. Wahrscheinlich lagen beim 7700K nur 4.4GHz an.

Ist auch meistens so. In Games zeigt mir MSI Afterburner OSD immer 4.4xx MHz an, 4500 hab ich da noch nie gesehen. Laut HWinfo erreicht er die aber immer mal in Windows.

PacmanX100
2017-04-14, 14:20:40
Ja, das ist ein wichtiger Punkt. Bei den 4-Kernen liegt der volle Takt eigentlich nur an wenn die anderen 3 nichts zu tun haben. Von daher werden die 4,5GHz kaum erreicht in den meisten Fällen... es reicht schon wenn im Hintergrund z.B. ein Virenscanner gerade seine arbeit tut und Windows 10 wieder Updates machen will. ;)

Daher sind die 6 bzw 8 Kerner gar nicht mal so schlecht ausgestattet da hier die Stufen andere sind. Beim Phenom X6 soll der Turbo schon bei 3 inaktiven greifen. Das dürfte in der Praxis wesentlich häufiger der Fall sein.
Es fehlt nicht mehr viel bis die 6, 8, 10 Kerner an den hochgezüchteten endlich vorbei sind. Wenn der Cache weiter aufgemotzt wird und andere Verbesserungen hinzu kommen sind die auch locker bei 2-3 Taktstufen weniger gleich gut oder besser.
Manche Xeons liegen schon bei 40 oder 45MB Cache. Müsste mal wer herausfinden ob das bei der Größe noch Zuwächse zur Folge hat. ;)