PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Intel - 8 threads vs. 6 cores


Badesalz
2022-11-09, 11:47:24
Moin.

Ich hab ja auch keine Probleme, außer Fremde bedrängen mich wieder mit Ware :usweet: Es ist aber halt keine Kaufberatung. Eigentlich geht's um "Technologie" :wink:

Grad schneit hier einer der Serverheinis rein, mit kleinen "Blister" in der Hand, und sagt (O-Ton): Er weiß ich hab ja noch eine andere ältere "Xeonkiste" und ob ich den haben will. Der passt da ja.

Icg gucke drauf, E5-1650v3. In der alten "Xeonkiste" ist grad ein E5-1630v3. Ich sag ihm das, er legt es auf den Tisch und meint beim Rausgehen, ich kann mal schauen und SMT ausknipsen. Das wäre nicht selten so, daß 4c/8t schlechter gehen als 6c/6c. "Sonst stells einfach in die Vitrine :tongue: ". Ja...

https://ark.intel.com/content/www/ru/ru/ark/products/82764/intel-xeon-processor-e51630-v3-10m-cache-3-70-ghz.html
https://ark.intel.com/content/www/us/en/ark/products/82765/intel-xeon-processor-e51650-v3-15m-cache-3-50-ghz.html

WAS SAGT IHR dazu aus der Nicht-Spieler Sicht? So wirklich heiß die CPU zu tauschen bin ich momentan nicht. Es sei denn jemand macht mich drauf heiß ;) Oder auch das Gegenteil behauptet.
Was sind eure eigenen Erfahrungen? Ich tue mich bisschen schwer passende Tests zu finden. Oder Berichte aus dem RL.
ST wäre wohl kein Thema. Die beiden liegen IMHO unter 1% auseinander. Aber die Idee mit 6c/6c v. 4c/8t. Ähhh… Das wurmt mich grad :usweet:

Wie würde sich das mit euren eigenen Tools und Programmen verhalten? Kann das wer für sich einschätzen?

PS:
OC ist leider nicht.

Daredevil
2022-11-09, 11:51:38
6/6 ist schneller als 4/8, trotzdem verstehe ich nicht, wieso das zur Debatte steht, weil 6/12 wiederum schneller ist.
HT bringt roundabout 30% mehr MT Leistung, do your Math.

Swissr
2022-11-09, 11:53:36
wieso 6C/6T? In dem von dir geschickten Link stehen 12 Threads, oder habe ich etwas übersehen?

Badesalz
2022-11-09, 12:10:49
Bezogen natürlich auf die beiden CPUs. Über den Schnitt eurer eigenen Ansammlung von Programme/Tools. Schätzungsweise natürlich. Falls ihr da schon mal drübergeschaut habt irgendwann. Und damit etwas dazu sagen könnt.
(hast du das auch so gemeint, DD?)

12 SMT Threads stehen sich oft nur auf den Füßen. Das ist nicht so die ideale Zahl ;) Jedenfalls ab und zu. Das hab ich schon mehrmals gefunden bisher.

@Swissr
Eigentlich ja, du hast so einiges übersehen =) In dem Post selbst.

Daredevil
2022-11-09, 12:13:50
Nein, ich habe folgendes gemeint:
6/6 ist schneller als 4/8, trotzdem verstehe ich nicht, wieso das zur Debatte steht, weil 6/12 wiederum schneller ist.
HT bringt roundabout 30% mehr MT Leistung, do your Math.

Jetzt mal ernsthaft, was ist denn so schwer daran, ein Satz zu verstehen?
Die größere CPU ist die schnellere, selbst wenn man HTT ausknipst. Die theoretische MT Leistung ist höher, es macht aber keinen Sinn, weil 6/12 natürlich mehr Reserven hergibt.

Badesalz
2022-11-09, 12:22:09
Deine Erfahrung mit Videoschnitt und Cinebench in alle Ehren, aber ich glaub du bist für das Thema untauglich. Sorry :)

Man liest sich mal in Apple Unterforum.

Swissr
2022-11-09, 12:34:33
Ich weiss ja auch nicht..
Du frägst nach Meinungen und Erfahrungen, und wenn dir einer das liefert sagst du dass derjenige für das Thema untauglich ist?

Das Problem ist dass wir hier nicht 4/8 vs 6/6 vergleichen sollten, sondern 4/8 vs 6/12. Es gibt einfach keinen Grund warum man die 12 Threads nicht laufen lassen sollte, nur weil scheinbar der Serverheini das meint und du keinen echten Test findest.

Es ist definitiv so, dass 6/6 mal besser und mal schlechter als 4/8 sein könnte. Aber wenn man die Möglichkeit von 6/12 vs 6/6 hat, und es nicht um Spiele geht, dann gewinnt 6/12. Und das definitiv vor 4/8.

G3cko
2022-11-09, 13:46:18
Der 1650v3 entspricht einem 5820k. Singelthread-Leistung der beiden Server CPUs nahezu identisch und zu vernachlässigen. Bei dem 1650v3 sind halt 2 Kerne mehr dabei. Deine Software kennst nur du. Wo ist jetzt genau die Frage?

Lehdro
2022-11-09, 14:12:49
Hast du spezielle Programme im Blick die du damit laufen lassen willst? Dann diese nehmen und den Rat von Daredevil befolgen, da sollten sich Benchmarks von vergleichbaren Fällen finden lassen. Diese Fälle gab es ja früher schon, ich denke da an 8700k vs 8600k vs. 7700k als Beispiel.

Besonders lecker in deinem Fall ist natürlich der massiv größere L3 Cache.
Ich für meinen Fall würde das aber auch so ranken: 4C/8T < 6C/6T << 6C/12T. Da das ganze sowieso uralter Haswellkram ist, steht dort eh nicht so viel MT Leistung zur Verfügung, weswegen HT noch eher hilfreich sein sollte, als bei einem moderneren SMT-losen 6 Kerner - so zumindest mein Gedankengang.
Zum Thema Programme die mit SMT nicht gut skalieren, ist mir im Desktopgebrauch nichts bekannt wo es massiv nachteilig sein sollte. Entweder skaliert es so oder so nicht mit SMT, oder es tut es halt. Performanceregressions sollten da nur sehr vereinzelt auftreten - ob das ganze dann aber noch performancekritisch ist, steht auf einem anderen Blatt -> Einzelfallentscheidungen.

Meine Idee wäre: Die CPU auf jeden Fall einbauen und in deinem Anwendungsspektrum selber mit HT on/off testen und dann hier die Ergebnisse mitteilen. Dann haben wir wenigstens alle einen definitiven Erkenntnisgewinn.

Badesalz
2022-11-09, 16:40:39
@DD
Danke. Danke für die Einsicht. Bester Mann :)

@Gecko
Die Fragen stehen direkt im ersten Beitrag.

Hast du spezielle Programme im Blick die du damit laufen lassen willst?An sich ja, aber "65%" davon ist eher auf single/dual Core ausgelegt. Sieht man daran, daß sich bei solchen oft ab 3 Threads die Leistungskurve strak abflacht :wink:

Besonders lecker in deinem Fall ist natürlich der massiv größere L3 Cache.Jaa... Der MT-Takt ist dafür beim 1630v3 halt höher. Da tun sich wohl meist Nuancen von Nuancen. MT läuft das System eh irgendwie immer dann, also wirkt der größere Cache imho fast nie, da sich den halt 6 cores und nicht 4 cores teilen.

Ich für meinen Fall würde das aber auch so ranken: 4C/8T < 6C/6T << 6C/12T. Da das ganze sowieso uralter Haswellkram ist, steht dort eh nicht so viel MT Leistung zur Verfügung, weswegen HT noch eher hilfreich sein sollte, als bei einem moderneren SMT-losen 6 KernerWir hatten schon im Forum das Thema mal (damals), daß in so... mixed Szenarios und dan alles avg. - der 3300s sich viel seltener vom 3600x verhauen lies.
Selbst in so einigen MT-Spielen damals waren damals die FPS (IMHO) nicht wirklich höher und der 3600er punktete eher noch nur mit einer bisschen größeren Beruhigung der Frametimes. (normiert)
Wobei BattlefieldV (jedenfalls in seinem ersten Jahr, genauso normiert), lief wesentlich besser mit 6c/6c als mit 4c/8t.

Bis 8t ist das alles noch recht überschaubar. Drüber fängt man langsam mit Anwendungsfällen an. Hier hab ich gedacht haben wir einiges an Spezis die was aus dem Nähkästchen erzählen können.
Wobei so langsam wird das Bild für mich diesbezüglich klarer ;) Wie ich schon hier mal sah
https://www.forum-3dcenter.org/vbulletin/showthread.php?p=13161327#post13161327

Meine Idee wäre: Die CPU auf jeden Fall einbauen und in deinem Anwendungsspektrum selber mit HT on/off testen und dann hier die Ergebnisse mitteilen. Dann haben wir wenigstens alle einen definitiven Erkenntnisgewinn.Ja. Steht so auf der Agenda, aber eine grobe Vorahnung hätt ich schon gerne :wink:

Mir ist das auch noch nicht mit den mem controllern klar. 4ch. bei 4 cores ist eine simple Vorstellung. 4 ch. bei 6 cores... Mich hätte auch die Topologie interessiert und die Durchsätze. Irgendwie finde ich da grad kaum was dazu :redface:

Platos
2022-11-09, 16:42:25
Warum willst du denn überhaupt HT ausschalten, wenn du es doch aktuell ja auch nutzt ? Wo ist da der Sinn?

Warum betreibst du jetzt den 4-Kerner mit HT, willst es aber beim 6-Kerner ausschalten?

Hamster
2022-11-09, 17:12:03
Es werden Erfahrungen aus Server-Sicht verlangt und verbittet sich Vergleiche mit Spielen anzuführen, argumentiert aber selbst mit Spielerfahrungen :ugly:

Kannst dir nicht ausdenken. :rolleyes:

Bau, wie Lehdro schon schrieb, die CPU ein, und teste es mit deinen Anwendungen selbst. Dann hast du zumindest Gewissheit und die unnötigen User-Frotzeleien, die ja nur gutmütig helfen wollen, haben ein Ende.

Badesalz
2022-11-09, 17:22:12
Jetzt nur wegen dem mit den mem controllern, hätte es ja jemanden geben können der da was von weiß. Das war auch nur hinterher zwischendurch gefragt. Grad eben. Nicht im ersten Post.

Savay
2022-11-09, 17:26:18
Die Controller hängen bei Intel am Mesh bzw. Ringbus.
Wo ist der Zusammenhang mit der Kernzahl?

Ehrlich gesagt nicht weniger konfus...Verzeihung...*hoch* wie die Eingangsfrage.

robbitop
2022-11-09, 17:33:13
Topologie: alle Kerne und alle Cache slices und der IMC hängen an einem Ringbus. Theoretisch macht die Anzahl der Hops (Anzahl der Teilnehmer steigert diese) einen Unterschied in der Memorylatenz aus. Der Haswell E Kern hat in beidem Falle aber deaktivierte Cores wo der Hop dann einfach "tot" ist. Ich würde annehmen, dass beide CPUs bei normiertem Takt und normiertem Speicher die gleiche Memorylatenz haben sollten.

Die Taktrate ist ja auch nur minimal niedriger auf dem 6C Modell. Meine Erwartung wäre, dass der größere L3 Cache mehr bringt als der Takt kostet. Natürlich abhängig von der Anwendung. Wenn deren Instructionset auch vorher zu einer sehr sehr hohen Hitrate führte macht es keinen Unterschied. Oftmals bringt es aber doch was.

Savay
2022-11-09, 17:35:22
Hier ist das etwas detaillierter zu Skylake beschrieben...da gab es zu Haswell wohl keine großen Änderungen.

https://en.wikichip.org/wiki/intel/microarchitectures/skylake_(client)#Memory_subsystem

Data from/to the individual cores are read/written into the L3 at a rate of 32B/cycle operating at Ring Clock frequency.

Badesalz
2022-11-09, 17:57:28
Die Controller hängen bei Intel am Mesh bzw. Ringbus.
Wo ist der Zusammenhang mit der Kernzahl?Ich kann mich auch völlig falsch an die Folien erinnern, aber da war mal was bei irgendeiner Version von Xeons. Etwas mit 3ch. vs. 4ch. und die 3 waren immer wesentlich schneller solange mit halt nicht im RAM-Limit war. Und das hatte meine ich auch was mit der Kernenzashl zu tun. DAHER die Frage - du weißt doch was eine Frage ist? - da ich mich nicht mehr ansatzweise erinnern kann welche Gen. die folien abhandelten und ob das wirklich was mit der Kernenzahl zu tun hatte und der 4, 8 und 16 vorn waren und die ungeraden nicht.
Vielleicht bring ich auch was durcheinander :frown: Daher halt die Frage, ob es da Besonderheiten gab/gibt. Wenn nicht, dann ist ja alles gut.

EDIT:
Das war bei Maschinen die NICHT den Speichertakt runterstufen, wenn alles belegt ist.