Archiv verlassen und diese Seite im Standarddesign anzeigen : Threadskalierung in Games (8 Threads vs. 4 Threads)
dargo
2014-01-27, 18:48:26
Es wird langsam Zeit aktuelle Games in Bezug auf weiteres Multithreading zu untersuchen. Dabei möchte ich herausfinden wie gut Spiele mit 8 Threads gegenüber 4 Threads skalieren. Quasi der nächste große Schritt in PC-Games. Da ich "nur" eine 4C/8T CPU besitze fällt die Skalierung selbstverständlich geringer gegenüber einer 8C/8T CPU, also echtem Octacore, aus. Dennoch denke ich kann man aus den Ergebnissen gut ableiten wie stark eine Engine bsw. ein Spiel mit 8 echten Cores skaliert.
Ich werde diesmal etwas anders vorgehen. Ich werde mich nicht mehr auf einen und den selben CPU-Takt über alle Games festsetzen, sondern diesen variabel in den jeweiligen Games auswählen. Natürlich achte ich weiterhin darauf, dass die Testszene vollständig im CPU-Limit liegt. Ich werde immer zwei unterschiedliche Taktraten verwenden um zusätzlich sehen zu können wie das Spiel mit erhöhten Takt skaliert. Zu guter Letzt werde ich untersuchen wie hoch die 4C/4T CPU getaktet werden muss damit sie die gleichen Frames liefert wie eine 4C/8T CPU.
Folgende Punkte sollten beachtet werden:
Der L3 Cache-Takt ist immer synchron zum CPU-Takt.
Ich versuche bei den unterschiedlichen Taktraten so gut wie nur möglich eine 1:1 Skalierung zu gewährleisten. Sprich... senke ich den CPU-Takt um bsw. 30% wird im Rahmen der vorhandenen Möglichkeiten auch die Speicherbandbreite um 30% gesenkt. Es wird immer kleine Abweichungen geben müssen. Leider lässt eine Haswell-Plattform nur recht grobe Schritte zu. Beim CPU-Takt wären das 100Mhz Schritte, beim Speicher-Takt die Speicherteiler DDR3-800, 1066, 1333, 1400 und 1600. Die Speichertimings bleiben immer identisch, siehe Testsystem.
Sämtliche Stromsparmechanismen der CPU sind bei den Tests deaktiviert. Der Turbo ist ebenfalls deaktiviert, bzw. alle Cores/Threads laufen immer mit einem festen Takt.
Testsystem:
Asrock H87 Pro4
Intel Xeon E3-1230 v3
Sapphire HD7970 @1050/1500Mhz
12GB DDR3-1600 9-9-9-24 2T
Windows 8 x64
Benchmarks:
Crysis 3 - Savegame 'Willkommen im Dschungel' mit maximalen Details
http://s14.directupload.net/images/140127/fzw85b3e.png
Bemerkung: bei Crysis 3 gibt es einen Bug bei der Timer Resolution wodurch je nach System nicht die volle CPU-Leistung abgefordert wird. Mit Hilfe vom externen Tool wurde die Timer Resolution von mir manuell auf 0,5ms gesetzt.
Edit:
Das Testsystem hat sich etwas geändert.
Testsystem:
Asrock H87 Pro4
Intel Xeon E3-1230 v3
HIS Radeon R9 390 IceQ X² OC @1020/1500Mhz
12GB DDR3-1600 9-9-9-24 2T
Windows 10 x64
Benchmarks:
F1 2015 - Rennen mit 20 Fahrzeugen beim stürmischen Wetter, maximale Details
https://abload.de/img/f120156alh3.png
dargo
2014-01-27, 18:48:51
Platzhalter...
dargo
2014-01-27, 18:49:17
Platzhalter 2...
Warum setzt Du den Takt nicht einheitlich auf 1600MHz fest und den Speicher bei 800? Ob das Spiel flüssig läuft, spielt doch keine Rolle, Dir geht es doch um die (Nicht-)Linearität.
dargo
2014-01-27, 18:54:56
Wirst du bald herausfinden. ;)
Botcruscher
2014-01-27, 20:04:05
Reagiert bei C3 eigentlich mehr als das Gras auf 8T?
dargo
2014-01-27, 20:31:08
Ist schwer zu sagen. Die CPU-Last ist beim Gras am stärksten. Ich denke aber auch, dass die 8 Threadskalierung bei der Grassimulation am stärksten zur Geltung kommt. Coda sagte mal die Grasphysik lässt sich wunderbar parallelisieren. Man muss halt erstmal Input zum parallelisieren haben.
Warum setzt Du den Takt nicht einheitlich auf 1600MHz fest und den Speicher bei 800? Ob das Spiel flüssig läuft, spielt doch keine Rolle, Dir geht es doch um die (Nicht-)Linearität.
Jetzt zu deinem Punkt.
Ich habe mich bewußt nicht für eine feste Taktrate über alle Testgames entschieden weil die CPU-Last von Game zu Game extrem unterschiedlich ausfällt. Würde ich nur 1,6Ghz bei Crysis 3 nehmen hätte ich eine Diashow und würde somit viel zu nah an der Grundlast landen. Die Grundlast ist dank der Grasphysik bzw. Simulation in C3 besonders hoch.
Nebenbei eine kleine Erklärung am Beispiel von Crysis 3 für die Wahl der Taktraten. Wie man sieht habe ich bei 3,7Ghz DDR3-1600 genommen. Also die Einstellung die ich auch ständig beim Spielen verwende. Bei der niedrigeren Taktrate habe ich bewusst 2,5Ghz CPU-Takt genommen. 3,7Ghz sind 48% mehr als 2,5Ghz. Damit die "Flaschenhälse" vergleichbar bleiben muss die Bandbreite bei 2,5Ghz entsprechend runter. Da mich die Speicherteiler in gewissen Maße einschränken habe ich DDR3-1066 genommen. DDR3-1600 ist 50% schneller als DDR3-1066. Normalerweile müsste ich DDR3-1080 nehmen, das geht aber nun mal nicht. Man ist beim Haswell nicht mehr so flexibel wie beim Lynnfield wo OC noch über BCLK ging und die Speicherbandbreite 1:1 mitskalierte.
Bei der Suche nach dem nötigen Takt für die 4C/4T CPU dient mir wieder die Ausgangsbasis von 2,5GHz und DDR3-1066. 3,1Ghz sind 24% mehr als 2,5Ghz. Dementsprechend muss die Bandbreite wieder hoch. DDR3-1333 ist 25% schneller als DDR3-1066. Also auch hier aufgrund der Einschränkungen ein kleiner Unterschied. Normalerweise müsste ich DDR3-1322 nehmen.
Übrigens... man sieht hier sehr schön den Einfluss der Grundlast. Bei 48% mehr Takt skaliert die Szene mit 62% mehr fps. Das dürfte auch der Grund sein warum nur 3,1Ghz bei 4C/4T nötig sind um die gleichen fps wie 2,5Ghz 4C/8T zu liefern obwohl die 8 Thread CPU @3,7Ghz eigentlich 33% schneller als die 4 Thread CPU ist. Dank der hohen Grundlast skaliert höherer Takt überproportional mit.
Das Spiel hab ich anscheinend auch - Kann mich gar nicht erinnern? Gibt es für den Test eine Anleitung inkl. Save game? Jetzt bin ich neugierig.
Würde Grundlast (durch bloated drivers) das schlechte Abschneiden der 2T Nividia Kombos erklären?
dargo
2014-01-27, 21:29:30
Das Spiel hab ich anscheinend auch - Kann mich gar nicht erinnern? Gibt es für den Test eine Anleitung inkl. Save game? Jetzt bin ich neugierig.
Boah... nicht mehr heute. :usad: Ich meine ich hätte hier im Forum das schon mal geschrieben. Muss ich mal suchen, machen wir aber die Tage mal... ok?
Würde Grundlast (durch bloated drivers) das schlechte Abschneiden der 2T Nividia Kombos erklären?
Nein... ich wüsste nicht warum die Grundlast plötzlich bei einer AMD-Graka geringer sein sollte. Dort hast du ja mit 2-3T mehr fps.
Übrigens... ich habe die fehlende Leistung beim Haswell endlich nach Monaten dank dem Hinweis von Untertaker gefunden. Dabei ging es hier um was völlig anderes. ;D
http://www.forum-3dcenter.org/vbulletin/showpost.php?p=10086329&postcount=446
Ich habe mich schon Monate lang gewundert warum ich nicht ganz die von mir errechneten fps gegenüber dem Lynnfield @3,7Ghz erreiche. Ich hatte in meinem Savegame mit 4C/8T und 3,7Ghz @Haswell immer nur ca. 52fps. Dabei war SMT nur 23% schneller als non SMT. Das klang für mich völlig unlogisch nachdem mir ein 3DC-User mein Savegame mit seinem Ivy Bridge gebencht hat. Bei dem war SMT über 30% schneller. Durch den indirekten Hinweis von Untertaker bin ich heute erst darauf gekommen. X-D Sobald man im Bios den L3-Takt auf "Auto" lässt taktet der je nach Last langsamer. Und das kostet Leistung. Jetzt habe ich den L3 Cache auch auf 3,7Ghz festgetackert und schon skaliert SMT in C3 mit 33%. =)
Da soll noch einer erzählen L3 langsamer CPU-Takt würde bei Haswell nichts kosten. Ich schiele da Richtung Lowkey. ;)
Air Force One
2014-01-27, 22:31:13
wo finde ich denn die Einstellung im Bios dazu?
Dürfte sich bei meinem Board sicher genau so nennen.
Ok habs jetzt gefunden.
Auf 37 stellen richtig?
Darüber hat bestimmt keinen Effekt oder? geht ja über 100.
Disconnected
2014-01-27, 22:45:08
Interessant ist vielleicht noch: um wieviel müssen 4C4T höher getaktet sein, um mit 4C8T mitzuhalten?
Lowkey
2014-01-27, 22:55:23
Interessant ist vielleicht noch: um wieviel müssen 4C4T höher getaktet sein, um mit 4C8T mitzuhalten?
Dreisatz?
1. 42,27 = 3700
2. 1 = 87,53252898
3. 56,33 = 4930,707357
Meine Frage wäre dann, ob man die fehlenden FPS mit Skill ausgleichen kann? :D
dargo
2014-01-28, 07:26:00
Auf 37 stellen richtig?
Den gleichen Multi wie beim CPU-Takt verwenden. Ergo bei dir 37... ja.
Interessant ist vielleicht noch: um wieviel müssen 4C4T höher getaktet sein, um mit 4C8T mitzuhalten?
Steht im Diagramm. ;)
Meine Frage wäre dann, ob man die fehlenden FPS mit Skill ausgleichen kann? :D
Ja. :D
Lowkey
2014-01-28, 08:50:55
Benchen mit dargo <--- treffender Titel.
http://www.forum-3dcenter.org/vbulletin/showpost.php?p=9854482&postcount=42
Mich würden jetzt noch 3C und 2C interessieren. (Mit und ohne HT)
Evtl. wäre es auch interessant, wenn man die Daten in ein Diagramm mit Thread*MHz bzw. Core*MHz auf der Abszisse und FPS auf der Ordinate darstellen würde.
Ich hab es eben mal probiert, und man bekommt auf diese Weise eine Andeutung, wie man die Grundlast messen könnte. Die Achse wird bei etwa 2 ThreadGHz (HT) bzw. 4CoreGHz (kein HT) geschnitten.
Disconnected
2014-01-28, 18:41:10
Dreisatz?
1. 42,27 = 3700
2. 1 = 87,53252898
3. 56,33 = 4930,707357
Meine Frage wäre dann, ob man die fehlenden FPS mit Skill ausgleichen kann? :D
Oh oh oh.... gaaanz schlecht.
Fehler Nr. 1: FPS und Taktrate skalieren nicht linear, zumindest nicht über die ganze Bandbreite.
Fehler Nr. 2: Wenn wir schon von linearen Funktionen ausgehen, dann sollten wir sie auch richtig berechnen und nicht Äpfel mit Birnen vergleichen. Es gäbe dann eben zwei Funktionen, eine für 4C4T und eine für 4C8T. Dafür nimmt man nicht eine Mischung aus allerlei Werten, sondern jeweils f(x)=d(y)/d(x)+n. Man müsste dann den gewünschten FPS-Wert suchen und dann je nach Funktion die entsprechende Taktfrequenz ablesen. Hat in der Realität aber keinen Sinn, da eben nicht linear. Aus diesem Grunde gibt es Benchmarks, weil man das Ergebnis eben nicht ausrechnen kann.
Steht im Diagramm. ;)
Dieses Diagramm ist für eine solche Darstellung recht ungeeignet. Besser wäre Taktrate auf die x-Achse und FPS auf die y-Achse legen. Dann jeweils einen Graphen für 4C4T und 4C8T eintragen. Leider hast Du bisher viel zu wenig Werte. Zumindest 3,1 GHz 4C8T sollte noch rein. Die Taktrate ist aufgrund Deiner CPU auf 3,7 GHz limitiert. Ich könnte noch weitere 600 MHz drauflegen und andere sogar noch mehr. Für eine tiefgreifende Analyse, ob mehr Threads oder mehr GHz was bringen, reicht das leider nicht aus.
Lowkey
2014-01-28, 18:45:53
@Disconnected
Wieso machst du es dann nicht? :D
Disconnected
2014-01-28, 18:50:49
Was machen?
dargo
2014-01-28, 19:16:48
@Disconnected
Du machst dir das viel zu kompliziert.
Bei 3,7Ghz skaliert SMT mit 33%. Bei 2,5Ghz mit 31%. Hier sollte beachtet werden, dass diese ca. 2% Unterschied Messschwankungen sind. Die Testszene trotz nur 5 Sekunden Länge ist recht dynamisch. Die avg.fps der einzelnen Messungen variieren etwas hinter dem Komma. Wir sprechen hier von bis zu ca. 0,6-0,8fps. Deshalb nehme ich auch 3 Durchgänge und daraus den Durchschnitt. Bei den einzelnen min.fps gibt es schon stärkere Schwankungen. Da ist es durchaus möglich, dass wir von bis zu 2fps Unterschiede sehen. Deshalb sollte man niemals min.fps in Savegames bewerten. Besonders bei dynamischen Szenen.
Um mit dem 2,5Ghz 4C/8T gleichzuziehen werden 3,1Ghz @4C/4T benötigt. Sind also nur 24% mehr Takt. Es sind in dieser Szene eben nur 24% mehr Takt nötig weil ich mich sehr nahe der Grundlast befinde und somit mehr Takt stärker als 1:1 mitskaliert (es wird also nicht 31-33% mehr Takt benötigt sondern eben nur 24%). Das sieht man auch bei den Vergleichen zwischen 3,7Ghz und 2,5Ghz. Ich habe mir schon bei der Auswahl der jeweiligen Taktraten ein paar Gedanken gemacht. ;)
Edit:
Um die fps vom 3,7Ghz 4C/8T zu erreichen wirst du garantiert mehr als um 24% höheren Takt @4C/4T benötigen weil du dich eben weiter von der Grundlast entfernst. Also irgendwo zwischen 24 und 31-33%. Je stärker man sich von der Grundlast entfernt umso näher nähert man sich einer 1:1 Skalierung durch mehr Takt.
Disconnected
2014-01-28, 19:27:48
Sorry, aber so ist das doch nur eine halbe Sache. Wenn Du natürlich nur beweisen willst 4C8T > 4C4T, brauchst Du dafür keine Diagramme o.ä.
Zu Deinem Edit: OK, nehmen wir an, nach einer gewissen Grundlast skalieren Takt und FPS linear. Dann nimm (FPS@3,7 GHz - FPS@2,5 GHz)/(3,7 GHz - 2,5 GHz). Dann hast Du den linearen Anstieg für die jeweilige Funktion.
dargo
2014-01-28, 19:44:29
Sorry, aber so ist das doch nur eine halbe Sache. Wenn Du natürlich nur beweisen willst 4C8T > 4C4T, brauchst Du dafür keine Diagramme o.ä.
Eben doch. Und man braucht auch unbedingt für so einen Test zwei unterschiedliche Taktraten und eben den letzten Punkt mit der benötigten Taktrate um auf die gleichen fps der 8 Thread CPU zu kommen weil du sonst nicht weiß wie stark sich die Grundlast auswirkt. Und mir gehts hier gewiss nicht darum zu zeigen, dass eine 4C/8T CPU mehr leistet als eine 4C/4T CPU beim gleichen Takt und der selben Architektur. Dafür brauche ich mir den riesen Aufwand nicht antun (dazu gehört ja nicht nur paar Benches machen, man muss die Ergebnisse auch verifizieren ob die überhaupt Sinn ergeben, wie oft habe ich schon völlig sinnlose Ergebnisse im Netz gesehen [oft liegt der Teufel im Detail], dann muss man cpu-limitierte Szenen suchen, und jeder weiß wie schwierig das ist seitdem freies Speichern in Spielen aufgegeben wurde, eine möglichst 100%-ige Reproduzierbarkeit muss nämlich bei solchen Tests immer gewährleistet sein). Das ist die CPU schon per se. Es geht darum zu sehen wie stark und ob überhaupt Spiel X von mehr als 4 Threads profitiert. Das steht aber auch schon im ersten Post so drin.
PS: da fällt mir gerade ein. Falls jemand hier einen Vergleich zwischen i7 und i5 ableiten möchte spricht nichts dagegen. Man sollte aber beachten, dass der i5 2MB L3 Cache weniger hat. Diese 6MB vom i5 kann ich im Test nicht simulieren. Es wäre als durchaus denkbar, dass der i7 praktisch noch etwas stärker zulegt. Wäre zumindest nicht unrealistisch wenn ich schon einen Zuwachs von ca. 6-8% verbuchen konnte wo ich den L3-Cachetakt festgetackert habe damit der 1:1 dem CPU-Takt entspricht. Ich sollte vielleicht diese wichtige Info im ersten Post noch einfügen. :uponder:
Disconnected
2014-01-28, 19:53:15
Das Problem ist: die FPS sind nicht festgemeiselt. Man hat normalerweise eine Zielframerate. Du hast zwei Anstiege, die sagen wir mal, linear skalieren, unterschiedlich stark. Anhand dieser könnte man dann ausrechnen, wie viel Takt ich für die Zielframerate benötige, jeweils für 4C4T und 4C8T.
dargo
2014-01-28, 20:04:17
Das Problem ist: die FPS sind nicht festgemeiselt. Man hat normalerweise eine Zielframerate. Du hast zwei Anstiege, die sagen wir mal, linear skalieren, unterschiedlich stark. Anhand dieser könnte man dann ausrechnen, wie viel Takt ich für die Zielframerate benötige, jeweils für 4C4T und 4C8T.
Imho wird das ganze Thema dann für die Leser zu kompliziert und viele werden es auch falsch verstehen. Du hast im Spiel einfach viel zu unterschiedliche CPU-Lasten. Und nicht nur das... auch unterschiedliche Threadlasten. Hast du eine Szene die schwächer mit 8 Threads skaliert brauchst du selbstverständlich auch weniger Takt beim 4-Threader für die gleichen fps. Willst du jetzt jede erdenkliche Spielszene darauf untersuchen? :D Dann viel Spaß dabei, mein Segen hast du. :popcorn:
Die prozentuale Skalierung mit 8 Threads die ich hier zeigen möchte sollte als "bis zu" angesehen werden. Ich versuche schon per se stark cpu-limitierte Szenen zu nehmen. Ich kann aber nicht garantieren, dass ich immer die Worst Cases, sowohl was CPU-Last als auch Thread-Last angeht, hier präsentiere. Sowas erfordert unheimlich viel Zeit für die ich hier nicht bezahlt werde. ;) Es ist also durchaus möglich, dass die erzielten Frames nicht die tiefsten vom Spiel sind. Diese sind für mich eher irrelevant, es geht nur um die Threadskalierung.
Leider hat keiner meinen Vorschlag aufgegriffen, die Darstellung in GHz*Thread bzw GHz*Core zu machen. Die Ergebnisse sind jedenfalls recht schlüssig. Es würde mich sehr interessieren, ob ein Test mit noch langsamerer CPU ins Bild passen würde.
Undertaker
2014-01-28, 21:07:37
Um mit dem 2,5Ghz 4C/8T gleichzuziehen werden 3,1Ghz @4C/4T benötigt. Sind also nur 24% mehr Takt. Es sind in dieser Szene eben nur 24% mehr Takt nötig weil ich mich sehr nahe der Grundlast befinde und somit mehr Takt stärker als 1:1 mitskaliert (es wird also nicht 31-33% mehr Takt benötigt sondern eben nur 24%).
Dazu noch eine Anmerkung: Wenn man Vergleiche bei gleicher Performance macht, sollte die Grundlast eigentlich keinen Einfluss darauf haben, ob nun SMT oder Takt besser skaliert. Beide Parameter werden Grundlast-bedingt besser als bei jeweils höheren Taktraten skalieren, an dem jeweils benötigten prozentualen Mehrtakt der 4C/4T-Lösung sollte sich nichts ändern.
Ein kleines Hintertürchen gibt es allerdings dennoch: Wenn die Grundlast schlecht parallelisierbar ist und nur aus wenigen Threads besteht, könnte es zu dem von dir beobachteten Verhalten kommen. (Andersherum wäre das aber auch denkbar: Gut parallelisierte Grundlast, aber ansonsten ein eher schlecht parallelisiertes Spiel -> bei niedrigerem Takt skaliert SMT in Relation zu Mehrtakt besser, bei höheren Taktraten schlechter).
dargo
2014-01-28, 21:35:38
@Undertaker
Hast du dabei bedacht, dass es sich hier nicht um 8 echte Cores handelt sondern um 4 echte und vier virtuelle?
Undertaker
2014-01-28, 21:42:57
Hmm, ich meine, das sollte daran nichts ändern. Ich denk aber nochmal drüber nach. ;)
dargo
2014-01-28, 21:43:45
Ich auch. ;D
Tesseract
2014-01-28, 22:02:24
Hast du dabei bedacht, dass es sich hier nicht um 8 echte Cores handelt sondern um 4 echte und vier virtuelle?
es sind 8 virtuelle. es gibt nicht den "großen" und den "kleinen" thread pro kern sondern nur die paarweise abhängigkeit.
wenn ein thread alleine 100% entspricht und du auf beiden virtuellen cores etwas ausführst läuft nicht einer auf 100% und der andere auf 20% sondern eher beide auf ~60%.
diese abhängigkeit gibt es in geringerem ausmaß auch zwischen den anderen cores weil die sich teile vom cache, dem speichercontroller usw. teilen. "echte" cores gibt es schon lange nicht mehr weil da viel zu viel redundant wäre. deswegen würde ich generell nicht von "echten" cores sprechen sondern von unterschiedlichen internen abhängigkeiten. intels architektur ist eine, die bewusst größere abhängigkeiten in kauf nimmt um dafür am anderen ende mehr transistoren für eine bessere IPC übrig zu haben wärend bei amd eher die unabhängigkeit der virtuellen cores berücksichtigt wurde was am ende aber IPC kostet. was von beiden (in der theorie) besser ist hängt davon ab wie man die CPUs typischerweise belastet.
Da gibt es schon noch ein paar mehr Abhängigkeiten deshalb kommt es ja zu Situationen wo HT Architekturen ins stocken und trudeln geraten (oder wie auch immer man das nennen mag?), wo FX8 noch mehr oder minder völlig unberührt verbleiben (solide weitermachen). Das sind die Situationen wo klar mehre relativ viel Last erzeugene Programme nebenher gleichzeitig am laufen und die selber in teilen ihrerseits dazu fähig gleich mehre Threads noch zu Beanspruchen!
PS: hat sich relativiert mit @Tesseract sein Edit bzw. weiteren Ausführen ;) ergo weitermachen
Ronny G.
2014-01-28, 22:47:41
PS: da fällt mir gerade ein. Falls jemand hier einen Vergleich zwischen i7 und i5 ableiten möchte spricht nichts dagegen. Man sollte aber beachten, dass der i5 2MB L3 Cache weniger hat. Diese 6MB vom i5 kann ich im Test nicht simulieren. Es wäre als durchaus denkbar, dass der i7 praktisch noch etwas stärker zulegt. Wäre zumindest nicht unrealistisch wenn ich schon einen Zuwachs von ca. 6-8% verbuchen konnte wo ich den L3-Cachetakt festgetackert habe damit der 1:1 dem CPU-Takt entspricht. Ich sollte vielleicht diese wichtige Info im ersten Post noch einfügen. :uponder:
Also auch ein "ECHTER" i7 hat im falle eines 4770 CPU´s auch "nur" die 8MB Cache... nicht umsonst nen man den Xeon E3 1230v3 den kleinen geheimen i7 zum Preis eines i5´s ....deswegen ja auch "Geheimtipp" :tongue:
Und was das Thema angeht kann man derzeit scheinbar echt nur Crysis 3 in betracht ziehen, die Zahl der Games die auf HT setzen ist leider sehr gering, dürfte aber vielleicht dank Mantle um einiges größer werden, den Mantle soll hervorragend mit mehr als 4 Kernen skalieren ... wohl wesentlich besser als es derzeit DirectX hinbekommt.
Lowkey
2014-01-28, 22:55:45
Mantle wird dermaßen gehyped, dass es langsam für einen Gegenstromaktion langt: "Die unrealistische Erwartung der Gamer an Mantle".
Ich mach mich mal an die 5 Ghz. Ich muss ja noch Dargo in Crysis 3 schlagen ... brb..
Ronny G.
2014-01-28, 23:05:08
Mantle wird dermaßen gehyped, dass es langsam für einen Gegenstromaktion langt: "Die unrealistische Erwartung der Gamer an Mantle".
Und ich lach mich kaputt wenn da was dran ist ....;D
....viel Spaß beim Hochtakten auf 5GHZ ....das ist dann nämlich der Punkt, während sich 4C/4T CPU´s bald bekotzen müssen vor OC und Hitze sowie Stabilität schüttelt das nen 4C/8T CPU noch undervoltéd, locker kühl von der Schulter, und darauf möchte man ja gerne mit dem Thema HT hinweißen...das man vorhandene Rechenkraft wesentlich effizienter nutzen kann, ohne großes TAMTAM :cool:
Botcruscher
2014-01-28, 23:11:56
HT bringt dir max 30%. Da nehme ich lieber den Takt mit. Beschämend ist eher die Diskussion darüber. Von Intel gibt es bald nur noch Grafikchips mit integrierter CPU. Da könnten auch locker schon 8 Kerne mit HT drin sein.
Ronny G.
2014-01-28, 23:19:47
HT bringt dir max 30%. Da nehme ich lieber den Takt mit. Beschämend ist eher die Diskussion darüber. Von Intel gibt es bald nur noch Grafikchips mit integrierter CPU. Da könnten auch locker schon 8 Kerne mit HT drin sein.
Mehr MHZ statt Threads bzw. Cores? ....Auch wenn sie mit mehr Abwärme und Energieverbrauch in Kauf genommen werden? Ziel ist es doch seit schon vielen Jahren das man die Pro-MHZ Leistung steigert anstatt neue GHZ Rekorde aufzuestellen, die völlig ineffizient sind ...also ist der Weg HT in meinen Augen nur ne Sinnvolle Erweiterung zum Thema Multi-Core bei der CPU ...
AMD macht ja momentan nix anderes als ihre Modelle mit ner Hammer TDP nach oben zu prügeln ....wollen wir sowas wirklich in der Zukunft?
Lowkey
2014-01-28, 23:46:53
In der Theorie, aber in der Praxis dauert es ein paar Jahre noch und dann haben wir wahrscheinlich echte 8-Kerner oder besser. Insofern denke ich, dass es keine Rolle spielt, ob man nun einen HT CPU oder eine K CPU nimmt. Unter dem Strich wäre nach meiner Meinung eine K-CPU bei allen Spielen vor einer HT-CPU. Aber das ist eben alles unwichtig, denn der Abstand ist nicht wirklich groß. Nur Mantle oder HT haben eben das Problem, dass sie Softwaresupport benötigen und dort herrscht immer Mangelware.
PS: Die CPU mag keine 5 Ghz.
Tesseract
2014-01-28, 23:48:47
Da könnten auch locker schon 8 Kerne mit HT drin sein.
oder 12-16 mit etwas niedrigerem takt. 4 haswell-kerne mit 2GHz sind etwa doppelt so energieeffizient wie 2 kerne mit 4GHz bei ähnlichem theoretischem throughput. den goldilocks-bereich haben alle aktuellen CPUs schon lange verlassen, die gehen über leichen um das letzte bischen single-thread-performance raus zu pressen wo es nur geht weil bei vielen anwendungen das threading nicht so recht mitspielt.
alternativ wär eine heterogene CPU mit einem starken und vielen effizienten cores auch keine so schlechte idee.
dargo
2014-01-29, 06:59:00
Und ich lach mich kaputt wenn da was dran ist ....;D
....viel Spaß beim Hochtakten auf 5GHZ ....das ist dann nämlich der Punkt, während sich 4C/4T CPU´s bald bekotzen müssen vor OC und Hitze sowie Stabilität schüttelt das nen 4C/8T CPU noch undervoltéd, locker kühl von der Schulter, und darauf möchte man ja gerne mit dem Thema HT hinweißen...das man vorhandene Rechenkraft wesentlich effizienter nutzen kann, ohne großes TAMTAM :cool:
Du bringst es auf den Punkt. ;)
Das war auch das was mich bei der Kaufentscheidung dazu bewegt hat einen "günstigen" 8-Threader zu nehmen. Es liegt aber auch zum großen Teil am schlechten OC von Haswell bzw. der deutlich höheren Temperatur sobald du die Vcore Richtung 1,2+V schiebst.
Lowkey
2014-01-29, 10:02:31
"deutlich höhere Temperaturen"?
BF4 sind 52° auf dem höchsten Kern bei 1.25v, 4,5 Ghz und Silent-Luft-Kühlung, wobei der Rechner aktuell sogar 50cm neben der Heizung steht ;)
dargo
2014-01-29, 10:29:38
Wenn die Graka ständig limitiert ist es auch kein Wunder. Lass mal AVX2 laufen. ;)
Lowkey
2014-01-29, 10:40:38
Die Grafik ist auf low details. Noch lower geht es nicht. Und AVX2 macht nichts über 82° - je nach Zimmertemperatur. Es gibt bloss noch weniger AVX2 Spiele als HT Spiele :D
dargo
2014-01-29, 10:43:28
Die Grafik ist auf low details. Noch lower geht es nicht.
Das liegt auch zum Teil daran, dass die DX-API limitiert. Mal schauen ob die Temps. mit Mantle merklich ansteigen.
Es gibt bloss noch weniger AVX2 Spiele als HT Spiele :D
Es gibt User die ihren Rechner nicht nur zum Spielen nutzen.
Nightspider
2014-01-29, 10:45:27
SMT wird mir hier imo auch zu schön geredet.
Wenn ich zwischen OC und SMT wählen müsste, würde ich derzeit IMMER OC wählen.
Lieber immer 20% mehr Leistung als selten 30%. Selbst wenn in einem Jahr viel mehr Games SMT nutzen, würde ich immer noch die 20% OC bevorzugen.
Wer es komplett richtig machen will greift zu einem i7 mit SMT und OC.
Es gibt User die ihren Rechner nicht nur zum Spielen nutzen.
Und das in einem Game-Thread. ;D
Botcruscher
2014-01-29, 11:14:30
Endlich mal wieder ein Klassiker. Das Thema hatten wir ja nicht bei 1vs 2 Kern oder bei den Quadcores. Gut, damals waren es wenigstens noch echte Kerne und kein HT Abfall. Die Software ist ja inzwischen überwiegend immerhin bei guter Zweikernunterstützung angekommen.:rolleyes: Der Blick zurück bestätigt eigentlich nur die Aussage:
Lieber immer 20% mehr Leistung als selten 30%.
dargo
2014-01-29, 11:32:00
SMT wird mir hier imo auch zu schön geredet.
Wenn ich zwischen OC und SMT wählen müsste, würde ich derzeit IMMER OC wählen.
Das muss dann jeder für sich selbst entscheiden. Ich hatte mich halt anders entschieden weil man eben speziell bei Haswell schnell beim OC in Temp.Limits kommt. Ich möchte jedenfalls keine ~80°C an der CPU haben. Liegt aber auch vielleicht daran, dass ich bestimmte Genres nicht spiele wie zb. RTS wo die Threadskalierung momentan eher miserabel ist und eben Takt zählt. In meinen Genres habe ich jedenfalls immer genug fps, selbst wenn das Spiel nur 4 Threads beschäftigen kann. Und damit meine ich 60+fps.
Und das in einem Game-Thread. ;D
Ja entschuldige... ich habe hier keinen Platz für zwei Rechner. Da muss man sich halt für den besten Kompromiss entscheiden. ;)
Exxtreme
2014-01-29, 13:16:26
SMT wird mir hier imo auch zu schön geredet.
Wenn ich zwischen OC und SMT wählen müsste, würde ich derzeit IMMER OC wählen.
Lieber immer 20% mehr Leistung als selten 30%. Selbst wenn in einem Jahr viel mehr Games SMT nutzen, würde ich immer noch die 20% OC bevorzugen.
Für 20% mehr Rechenleistung im OC musst du schon recht heftig übertakten. ;) Und die 30% mehr Leistung durch HT sind nicht nur selten sondern sehr selten, zumindest in Spielen. Bei Servern sieht das anders aus und da hat man die 20 - 30% praktisch immer.
Butterfly
2014-01-29, 15:26:43
@dargo
Hab es mal mit 8 vs 4 FX Kerne getestet.
Timer Resolution ebenfalls auf 0,5ms eingestellt.
Ich hab alle Energieoptionen aktivert im Bios ink. EPU auf Maximum Power saving.
In Windows das Energieprofil Höchstleistung und GPU Power Limit bei 0%.
Testsystem:
ASUS Sabertooth 990FX/Gen3 R2.0
AMD FX-8350 @ HPC Mode (1.4/4.1/4.2GHz, CPU-NB/HT-Link @ 2.6GHz)
1x XFX R7970 DD @ 925/1375MHz, Catalyst 13.12 WHQL (Standard Einstellungen)
8GB DDR3-2133 11-11-11-30 1T
Windows 7 Prof. 64 Bit
X4:
Frames, Time (ms), Min, Max, Avg
864, 20000, 33, 50, 43.200
X8:
Frames, Time (ms), Min, Max, Avg
1418, 20000, 57, 86, 70.900
Die Testscene ist flüssig mit dem X4 aber so bald man anfängt sich umzusehen, geht es runter auf 20FPS.
Hab nicht gedacht das es so viel aus macht! :freak:
dargo
2014-01-29, 15:32:03
Würde eher empfehlen die Energieoptionen im Bios abzuschalten. Ich weiß allerdings nicht was da so alles bei einer FX-Plattform passiert. Zudem setz mal die Testszene auf 5 Sekunden runter. Die Benchanleitung hast du ja in diesem Thread. Nimmst du exakt die gleiche Testszene wie ich?
Butterfly
2014-01-29, 15:44:59
@dargo
Wenn ich die Energieoptionen aus mache kann ich auch gleich auf 5GHz hoch gehen. :D
Es war die Map "Fields" die auch bei PCGH genutzt wird: http://www.pcgameshardware.de/Crysis-3-PC-235317/Tests/Crysis-3-Benchmark-Test-Grafikkarten-1056218/
Nach dem ich nichts gelesen habe welche Map, dachte ich du beziehst dich auf die Scene.
X8 / X4
http://abload.de/thumb/crysis32014-01-2914-5oojms.jpg (http://abload.de/image.php?img=crysis32014-01-2914-5oojms.jpg) http://abload.de/thumb/crysis32014-01-2915-0h7kgz.jpg (http://abload.de/image.php?img=crysis32014-01-2915-0h7kgz.jpg)
Der Vergleich FX-4 vs FX-8 ist valid, da gleiche Einstellungen genutzt wurden, ob er zu deinen Werten valid ist, musst du noch äußern. :smile:
dargo
2014-01-29, 15:48:28
Achso... und ich wundere mich schon hier über die ~71fps bei dir. :D Die PCGH-Szene ist noch ziemlich harmlos was CPU-Last angeht. Nimm mal meine. ;)
http://www.forum-3dcenter.org/vbulletin/showpost.php?p=10087960&postcount=14
Bitte den ersten Durchgang nicht bewerten und lasse dich immer nach dem Bench von der KI töten! damit du wieder die Anfangsszene siehst.
Ronny G.
2014-01-29, 16:59:48
@dargo
hast du den Level 3 Cache auch bei 3,7Ghz Manuel im Bios fixiert? Bringt das irgendwelche Punkte, habe an der Sache nie was verändert und alles auf Auto gelassen...
Und probiere ruhig mal die CPU bei 1V zu betreiben, meiner läuft exakt mit 1,010V Stabil und schön Kühl....das ganze nur Boxed gekühlt.
Ich werde die Crysis Szene morgen wenn ich daheim bin auch mal testet....dabei werden aber bei fast gleichen System keine neuen Erkenntnisse kommen, was hast für ne Graka?
@Botcruscher
HT ist ganz sicher kein Abfall, es ist die logische Konsequenz aus optimaler Core Nutzung.
Mein kleiner Atom im Netbook wäre ohne HT vermutlich der absolute Krüppel .....so iss er nur ein Krüppel;D
dargo
2014-01-29, 17:46:31
@dargo
hast du den Level 3 Cache auch bei 3,7Ghz Manuel im Bios fixiert?
Jawohl.
Ich hatte mich schon seit ca. 2 Monaten gewundert warum ich in der C3-Szene nur 52,xxfps mit 8 Threads erreiche. Als ich den Lynnfield i5 @3,7Ghz hatte habe ich mir einen Leistungszuwachs von über 80% ausgerechnet, nachdem ein freundlicher Member hier die gleiche Szene mit seinem Ivy Bridge i7 getestet hat. Komischerweise hatte ich diese 80+% nicht erreicht. Gleichzeitig wunderte es mich, dass die 8 Threads bei mir nur mit 23% skalieren gegenüber 4 Threads. Beim Ivy waren es über 30%.
Nach dem Hinweis von Undertaker (in seinem Bild konnte man sehen, dass Haswell automatisch den L3 runtertaktet) ist mir ein Licht aufgegangen. Der L3 ist beim Haswell "entkoppelt". Damit der 1:1 mit dem CPU-Takt mitläuft muss man den eben festtackern. Und schon passen die Frames sowie die SMT-Skalierung wie ich sie mir vorgestellt habe.
Bringt das irgendwelche Punkte, habe an der Sache nie was verändert und alles auf Auto gelassen...
Ja... in der C3-Szene konnte ich einen Zuwachs von 6-8% verbuchen vs. "Auto". Bei Auto wird also der L3 untertaktet, ich weiß allerdings nicht wie stark. Habs nicht geprüft.
Und probiere ruhig mal die CPU bei 1V zu betreiben, meiner läuft exakt mit 1,010V Stabil und schön Kühl....das ganze nur Boxed gekühlt.
So tief war ich schon. Für AVX2 reicht das nicht. In Games und AVX1 ist es aber kein Problem... also die 1,01V.
Ich werde die Crysis Szene morgen wenn ich daheim bin auch mal testet....dabei werden aber bei fast gleichen System keine neuen Erkenntnisse kommen, was hast für ne Graka?
Unter dem Avatarbild ist so ein Rechnersymbol. ;) Und im ersten Post stehts auch. :eek:
Edit:
@Lowkey
Mir fällt bei der Diskussion zum L3-Takt auf, dass kein festgetackerter L3 höchstwahrscheinlich besonders bei SMT, bzw. 8 Threads relativ stark Frames liegen lässt. Dafür spricht auch die geringere SMT-Skalierung.
Butterfly
2014-01-29, 18:18:58
Achso... und ich wundere mich schon hier über die ~71fps bei dir. :D Die PCGH-Szene ist noch ziemlich harmlos was CPU-Last angeht. Nimm mal meine. ;)
http://www.forum-3dcenter.org/vbulletin/showpost.php?p=10087960&postcount=14
Bitte den ersten Durchgang nicht bewerten und lasse dich immer nach dem Bench von der KI töten! damit du wieder die Anfangsszene siehst.
Ok, dann ist der Unterschied verständlich!
Deine Scene ist wirklich sehr CPU limitiert, CfX bringt bei den Einstellungen nicht mehr FPS, läuft jedoch subjektiv nicht schlechter.
Erst wenn viel Unschärfe und Raketen vom großen Geschützturm kommen bringt CrossfireX mehr FPS.
X4
Frames, Time (ms), Min, Max, Avg
106, 5000, 18, 24, 21.200
X8
Frames, Time (ms), Min, Max, Avg
213, 5000, 37, 48, 42.600
dargo
2014-01-29, 18:27:02
@Butterfly
Danke für den Vergleich!
Man.. die Skalierung ist der Hammer. Da hat Crytek echt nicht zuviel versprochen. Ich freue mich schon in wenigen Jahren auf einen Haswell-E Nachfolger mit 8C/16T. Das wird ne Bombe. :eek: Hoffentlich kriegt man so eine CPU in 4-5 Jahren für 250-300€. :biggrin:
Butterfly
2014-01-29, 19:09:39
@dargo
250-300€ wäre schon ein Hammer Preis für ein 8C/16T.
Naja, man wird ja noch Träumen dürfen. :smile:
Allerdings bringt das dann nur was in der Scene und für 5 Sekunden. :freak:
Wenn ich mich von der KI töten hab lassen, musste ich auch ohne Panzerung richtig in die Raketen laufen, mit CfX sind es dann zwischen 50-80FPS.
Übrigens hast du Blendflecken an und Tiefenunschärfe auf hoch gehabt? (Bei mir war beides an)
P.S. Ich musste den Timer offen lassen in der Taskleiste, sonst geht der Wert zurück auf 1ms.
rob]SK[
2014-01-29, 19:14:15
wenn ich meine neue grafikkarte habe werd ich mal auch durchtesten. oder merkt ihr die skalierung auch bei einer mid range grafikkarte ? in low details und 640 hats ja sicher keinen sinn zu testen.
mfg rob
dargo
2014-01-29, 19:14:30
Wenn ich max. Details schreibe dann meine ich auch max. Details. :wink:
@rob
Low Details bringen eh nichts da du einen riesen Batzen der CPU-Last weg nimmst. Das kann gerne Butterfly probieren. Alles @max. lassen und nur die Objektdetails auf Mittel stellen. Schon staunt man über die hohen fps. ;) Kein Wunder... die Grasdichte nimmt erheblich ab und auch das LoD ist wesentlich agressiver.
Butterfly
2014-01-29, 19:47:53
Wenn ich max. Details schreibe dann meine ich auch max. Details. :wink:
OK, :biggrin:
Das kann gerne Butterfly probieren. Alles @max. lassen und nur die Objektdetails auf Mittel stellen.
Gut, aber zuvor noch mit 5GHz, der Rest ist gleich_
Frames, Time (ms), Min, Max, Avg
293, 5000, 51, 62, 58.600
Objekt Details auf Mittel:
Frames, Time (ms), Min, Max, Avg
361, 5000, 63, 77, 72.200
Disconnected
2014-01-30, 18:12:57
Was mich persönlich mehr interessieren würde, wäre: wie schlägt sich 2C4T gegen 4C4T?
Thunder99
2014-01-31, 11:40:28
Sehr nice Dargo.
Was mich jetzt auch interessiert ist wie sich der L3 Cache Takt bei 4Threads auswirkt. D.h. ob es genau so ein Performance Verlust gibt wenn der L3 bei 3,2GHz ist und der CPU Takt bei 3,7GHz :)
dargo
2014-01-31, 11:57:23
Sry, aber Prime95 ist doch Mumpitz. Nehm den Linpack von Intel und du kannst froh sein, dass du unter 80°C bleibst (zumindest bei festgetackertem Takt):
Quark zum x-ten Male.
Sehr nice Dargo.
Was mich jetzt auch interessiert ist wie sich der L3 Cache Takt bei 4Threads auswirkt. D.h. ob es genau so ein Performance Verlust gibt wenn der L3 bei 3,2GHz ist und der CPU Takt bei 3,7GHz :)
Anscheinend nicht, oder höchstens minimal.
C3-Szene:
SMT-Skalierung @L3-Auto = +23%
SMT-Skalierung @L3 1:1 CPU-Takt = +33%
dargo
2014-02-04, 11:47:19
@Dargo
Sind die Platzhalter in Post 2+ für Spiele gedacht, die von HT stark profitieren?
Für kommende Spiele-Tests... ja.
Gipsel
2014-02-12, 19:52:18
Die allgemeine Haswell-Diskussion könnt Ihr übrigens hier (http://www.forum-3dcenter.org/vbulletin/showthread.php?p=10107520#post10107520) weiterführen.
Hübie
2014-02-12, 20:02:31
Danke Gipsel. War überfällig.
Ich hätte jetzt gerne mal die Zeit um die Tests nachzustellen denn dass ist nach wie vor ein interessantes Thema und ein klares Ergebnis gibt es ja immer noch nicht.
dargo
2016-03-05, 17:44:26
*ausgrab* :D
Formel 1 2015 ist dazu gekommen.
http://www.forum-3dcenter.org/vbulletin/showpost.php?p=10087518&postcount=1
btw.
Warte schon gespannt auf den DX12 Patch, was der noch so alles reißen kann. :tongue:
Na dann wird es Zeit für the Division und Ashes of Singularity :-)
http://abload.de/thumb/thedivision_2016_02_2owker.jpg (http://abload.de/image.php?img=thedivision_2016_02_2owker.jpg) http://abload.de/thumb/thedivision_2016_02_26vkjy.jpg (http://abload.de/image.php?img=thedivision_2016_02_26vkjy.jpg) http://abload.de/thumb/thedivision_2016_02_23ajpu.jpg (http://abload.de/image.php?img=thedivision_2016_02_23ajpu.jpg)
http://abload.de/thumb/ashes_4_kernen6kc5.jpg (http://abload.de/image.php?img=ashes_4_kernen6kc5.jpg) http://abload.de/thumb/ashes_8kerneu7kb0.jpg (http://abload.de/image.php?img=ashes_8kerneu7kb0.jpg)
Hübie
2016-03-05, 18:08:15
Welches OS nutzt du, HisN? Ich habe übelst Probleme wenn ich von 6/6 oder 6/12 auf 4/4 oder 4/8 und anschließend wieder zurück gehe. Dann ist Windoof 10 der Meinung auf einem anderen Rechner zu laufen und verweigert mit jedem Start sofort den Dienst per Bluescreen. Hast du dafür ein workaround oder eine Lösung parat? Seit meinem letzten Ausflug meide ich solche Spielchen...
Das ist Win10 x64
Und ich bin langweilig, ich tabbe aus dem Spiel raus und änder einfach nur die Kern-Zugehörigkeit, sofern das geht (geht bei Ashes nicht).
Die Änderung von HT auf Nicht-HT stört mein Windows nicht.
Das spielen in der MSCONFIG für die Kern-Anzahl auch nicht.
Kein Workaround nötig bei mir. Du hast bestimmt ein Clean-Install von Deinem Win10 gemacht und kein Upgrade, oder?
Hübie
2016-03-05, 18:25:19
Ach?! Jetzt wo du es sagst: Ich hatte zuvor per msconfig die Kernzahl festgelegt. Das wird wahrscheinlich der Genickbruch meines Windows gewesen sein. :up:
Ich hatte dass im UEFI geändert. HT on/off war auch kein Problem, aber physische Kerne... Da war Sense. Selbst als ich auf Urzustand zurück ging.
Danke für den Hinweis. :D
IchoTolot
2017-04-25, 16:38:08
Seit dem Video von Rawiioli (https://youtu.be/XKzu2sF8k4k?list=FLGqLGYIlr3LGuWnB3OYJ5TA)stellt sich mir die Frage bis zu wievielen Threads die Spiele denn wirklich skalieren. Da diese Spiele noch in diversen Benchmarks auftauchen ist es sinnvoll das mal zu wissen. Vielleicht kann man hier mal auflisten welche Spiele bis wohin skalieren.
Wäre praktisch wenn sich auch Ryzennutzer finden lassen würden, weil die haben mehr Threads zur Verfügung als ich.
Persönlich getestet habe ich es jetzt mit Far Cry 4 und Battlefield 1
Far Cry 4
Alles mit Minimum Details und die Stelle wenn man Story beginnt und dann beim abgestürzten Auto im Wald steht und die Wachen einen suchen.
1 Thread 49
2 Threads 99
3 Threads 156
4 Threads 164
5 Threads 180
6 Threads 180
7 Threads 179
8 Threads 178
Battlefield 1
Weiß nicht mehr welche Mission, einfach Kampagne gestartet und diese wo man dann im Luftschiff was machen muss.
1080p low Details
GPU war am Ende etwas über 60% ausgelastet.
1 Thread = 12 FPS
2 Threads = 36 FPS
3 Threads = 80 FPS
4 Threads = 150 FPS
5 Threads = 257 FPS
6 Threads = 266 FPS
7 Threads = 287 FPS
8 Threads = 280 FPS
Der_Korken
2017-04-25, 17:41:03
Wie hast du die unterschiedliche Thread-Zahl getestet? Man müsste schon differenzieren, wieviele echte Cores sich dahinter verbergen, denn 2C/4T wird sicherlich schlechter als 4C/4T sein, auch wenn beides vier Threads sind. Gerade fünf oder sieben Threads sind bei vier Kernen ziemlich "schief". In dem verlinkten Video wurden explizit (logische) CPU-Kerne zugewiesen, sodass man alle Kombinationen (1C/1T, 1C/2T, 2C/2T, 2C/4T, 3C/3T, usw.) erfasst.
IchoTolot
2017-04-25, 17:45:11
Das Problem ist, dass du nicht einen nativen Kern zuweisen kannst, nur Threads. Wenn du also "CPU" 1,3,5 und 7 zuweist was ja so HT-Kerne wären, werden trotzdem die nativen kerne genommen, was auch sonst. Windows unterschiedet da nicht. Warum sollte es dann zwanghaft nur 27% (HT) der CPU nutzen? Hab ich auch schon getestet und bin dadurch erst drauf gekommen.
ich hab die im Taskmanager einfach über die Affinität zugewiesen.
Crysis 3
1 Thread = 47 FPS
2 Threads = 55 FPS
3 Threads = 96 FPS
4 Threads = 129 FPS
5 Threads = 160 FPS
6 Threads = 184 FPS
7 Threads = 209 FPS
8 Threads = 213 FPS
Screenshots Crysis 3:
https://lh3.googleusercontent.com/2W1h3Jo8mEv45LtYEd1baxSrb3mmtBdDi15EtAh5dPI_GiYFQSGs5-AwH_2Tes2nFuqfqwryANnc6K4xxYJ_QrTJQgH9B7l4G7v1qCo8cjf3PU_kJyu_MmeRrED1sKZHfZfUbp 9zofGoGzsY7Nsc9uw6t-hjxjpK8hJGAtBl7phlS-dBjPSq84qxhQFBvisiadl7Z19MAhExHTCZ3nh1R3wn_HDu3EZNyXAdjngaxBcGLm98uRR_0g3nJzdWIk k1Qc04ktp2tl0Nh5EbTh7kqjwT8cKiVpdTmE8yADPVXCuvE0SjwoCpvmY8RPKOE9NqLQpy7usmDlyYSL pJTqOVHBBkMsDDz4x1ATDeCs6USJWBV4C_kNyPPs0g-6JdxNWvf_2i3hQucHzS7FAbrJbE7mh9ny2hByYFdgqRLmDEqaFjxavQlCCeliZ-d8rdD-47GiWSuYxZcunA1GVRhZz-RrmfUk-ecqJaMH90eDmF88UWNSrbtirpAUy7MUGt8pIEDG4m6IKhZlkcOYB75eTPNoksUvPkvyGW3TZ5iod5NLf M02EabrheFogR9m3AE1pliifToIPmpbcFJTGQtfX6wUtx3B38yFZTFRIpXqpwbrSNbDDr3bmI6A=w128 0-h720-no
https://lh3.googleusercontent.com/WVZfLzuVFcWS4M0yTxYZ4xxoZlbVjVVsfUtwJPQ9blAEw6pzJh9IncFfr2uWwWLLfvXyYsKNsubU9ICs au5oV3ln2vppByshUjOrefMDh0E2kDreHKD54-0dpX3rPPLmtUFbCf8gQZlMB2Ns-W0_X2YECPTab1PwGB2BSxe9AqVs7COl2X-J1Agi_8plpGxKNfojlvYFpb5VuUe7oii_BqmXbRFkxSYH-QO7BD1clPa_sCdY7oTOJmxIHPppycFIoNfzGMNQ4Sb4LG9nSScxKERxVIPj8NDoU0mK4_W_da9-XxixqbTlG3jbSzUxZKjNpFCfVhjOYPihdClKFJruw1KR2REZ733d4B48EF55ssHG8dcatvkJKWsNGLKI 1dcKA8QSMokTfA8I3D0GYCLiD5bbFC2REkml3wVDymHbbmXyJE2-ycZybwW_VKg-z3Id6AZd5AyvWsVM8BXw77tCKgBI0fhbowtm1Yh1yiPW-Vn1PriNf0-20XgdlpYjChirJLSsn1EKtYgaWO7ULqZwvdfoDCs2R1XmU4QQBNyU4-cUy_soFmjiBEfcmdO3ACiDFfIuPbfPkwOAI5U8rr15XuVZxBsIc2PQ92pg68c8DrgUPKulo4nnCA=w12 80-h720-no
https://lh3.googleusercontent.com/TSFeZK9E3UZyFo29p8nJxFAI9tF9GJFmOlZ09LGkbnkQeDCd3H8hGInmEkbX1KaFUxKvIUp2wPtKyK4x oRRdIVLrtDcUTVjYe6DdV6DqBq73da1oY5jrAQXPg0S-trvmpp0HDMvLhWD6fOHy47hiykdNhpRZo7mMJ7WOGkarleG3NE-IrQfpP6LYvdsBIV0tahj2jddiVvGwp718U5axJvzC_3bxNCK0N9n5dXBgNC0g7rV_ol6_q_etQil5OtT DbNCJtVj8FzNP7qxK4_j1822-apMC4GPr-1LiopKFXFXidfP9awKh-2FGL2p0Bvml5vXqIDp0OiSRSQ6n8rtiROYqQUMWcBzVeBKgDwchnTz52XbQ78v_NCfqEEtIXRChJaIv-Taxc3j9ZGkMib-8Ia64wxRkAF7T1vwMBrRAKv0X3FZA7bdY37EQtkjTwO8u6fe1v_i9z1BYO0niuC_LHcUVQb9-uFIs5xOaBOGQd72GtorDKYKavnBZqc1Uy_BasLBPk3qKK-oYWCI1_mcNDkZowFSrdT7TGOunx8yu3S56-q_0nP2xCIxbFdfDDtzKrWFo1jd9Wofd1pi61k9OwxzYITvW3beyOyxc9XZc2S_m2_l9UTopww=w1280-h720-no
https://lh3.googleusercontent.com/KVU8KlzFEphDUY6P4EQCY2r19c5SwkLH3FCoftcwksvFEIL1DE3EOXo9IlEZ62rYF8KMrlR6DD5EhHp3 YBX86axGvVDv3yJGkpY6BIqfWJANyzySyuL83oni03EdsaohUCR5hxMV0NO59OnoEQVHSr1ugJ27mPOL iY59boS57UtMnIAh05UdtV8nX-rAxQYQ2UPU21r9R4LBJYbYoxQZCRFNe7cGfZxNJZRTXW8tHwr1AnhYmT38xL28eJxmBjCOgCNEgHdXtd vFYu5cMHAjCij7pjjDrCbUYIKfXiqCG2SsASkPXyakEF86lJ_4I3l_m3vdpkvpSf_LdB4i8U7ASJ1PKb 7YcDQ-ar6OpemBUnn3bB55CngkyQV7PmAQEzleVj0tFAsJWTWW39eHX3cynQPLGVL9oQZN6VZqZ9vGJ4dYxilt HYQB_-tihH2ObTNcr1e1FMEuvRQ07hUlr8LWunk1UKffxQ9x23HvLOV5BnPz94P2hjFauo-t3JLJsbPfwMoRsDshse63NNjx0Ucihv2dIHv6GMeWrYG8DjHFG2et5bERCpwO4O6VfSip-FhLPafCQiyyTSCwDdqc9ArqI4_CQWySNmzZRkbjVo2XjgCTKL_ite8qpw=w1280-h720-no
https://lh3.googleusercontent.com/j2Kyi1ofeIC_rYwzVexDuDXObITIVsueCvHiq1EKTJooJH-P_Kx1OXPW7akxreQwYtp-E9ozK6UjDzycWHJetyXo95lrSWlwONmkjQjaP4eXDN-3_ZkwkkqhI667ls6fmWPa1cZmmQ6fIK28jfZuQ__YnDdX6dyrfCMbg_wKboo7AjCxMbWBaQyz010RBIr 3P8f7g9ZFPQskI0Cl7hKQGlpBZEYSne0BxDnS45vyEBsQgsSboSciZkSu-SYZO5fR_yChaBrQRhwlEj0ftrpIKezbXvLrbI0YwlQZaP6wm470uWmTMgSVMkIKE8PDFMlzzwNorBHn9 ze9CX1eCnQl4E9s4tnYA5xi_9XCp09zXRKgrqeBgT1FCsnQDPTNBxPS9ZnR10XI_iTi0sEouN27Ea_jb 9YPnUrBgqYj9pWObLdLMTdQZXqeKQ2YAssZSGw1XaSSO6tTqaY2Xf1uyiXTC9dD-TeN8FEyZlAd15Il0I1mfKmhb_fRbOEode5eZO9E2lMn5zPBWxwHBIBb-QkpTmLCVE2IPMejuPG5PiXLKlS2UEIipwuLwJkDOiosb5Jw-y7X74e3FmBr5c9QQaVgwnkHpeKb6Ugl3WDZGTXYIdAc05VAwwAwIQ=w1280-h720-no
https://lh3.googleusercontent.com/-C-e9rKq2F5betj9CR4WkEiBlv5BXzYsI-clkE5BCcepd499RgIOFobKNOeuB1oA23XP_sMUcPndVusKYaVWtHa23a25Dhd5d5NtVZKryROElTH0C7 KwH6aNvIgWUBC7OOkr7rr1MIRvhFcLd5VuDmR7DIwG1S6yZwysMCN_Ev-yzh-MwzFB6Cwxf9TwNotIQKGqjVhVEYDfkY8QByQbrwT2UJOBSPNAv5A7gf92WM2VOTwS3di-ZiiUP3HqILhmNOc0dgZCCCt-XWhOH_V4yxxNJxF3jtZG_3k3IFony7GPX8ja3Jo8D3JJpMcEpI6QfrmKyjHgqOmlQr7FBu0OtiAzg4P9 AOdSdE8cbPuKYUwW_okg0mN4OsJ_eZlzBP0cCPBbRqDCNYnb6EIvj3n2Ovks54YVZazNxd0IOFVgNkUx RQ7UANoxvwj6MtpGC703yrtijzkUliqQ2O3vxXk9vdRCe5NIME0cCMY2oAuNPo_Vf4du9BpIlGxgDstV mGN55Dqfgqy-DBwljerl-W6v3fHByTxck2LMNuLvAWtD-wDl5PyR_TlT7413I-WOeBGb1Y0l5E3jqbRdnJhUCXRyNfFpqi-GPAApFUzu6XjGzP1gbtoSn6YPVQ=w1280-h720-no
https://lh3.googleusercontent.com/Vhs3xvNJmWtCEV4sBbO4idmuDleQZCsmI5jyjvXwKre0ATGFmHQ9WRa3G2Pba1f3RCJ9HlECOH1qDIFM plvPstO9mEOkvR6ldzDLJ9MRqMBRLKdVKkQbfxg0O-EnG8oMEzz_b3XUeHd34INoGhXxXtyy2xR-xgz1PclaTfVn8JQGkp53S1WoW8iSBl5nHY2-OLWVKDgwTOkV0vIPLpZEX27UMEL8cvEoNosWq_2_A7mzlMaqVhyDBSlojKozo7SlmSJ4lyja7iz94Szm Nq645YiWCFwv__CEtJgMvEloJDa6oS8W3THh-PZ_b5JJUEgkvuf6Wy0L0ji0Ga2ngBwlbe1NDsO4zd4g26ySg0eErB4OXovVeOQk9LawUOrVlSFVe1TvQ q4aGlwZ9WO8vCTSzsP6ohv24S6MsC7559yA8232fGRMVR19IU38M4H563_5C13ravkspijTg4m35VilV JTRHbw7vhWtvXA_xovW7BDNHmvPsU2f_Om53jywp6OOzPwaGvLX899GAN18EWZoVrt5T-EOXPt3QphBRKi-komBZy1SMOsMtWzBpPNIn_HJUSDR2jy1-fFYL0sGF0lolsvhTKtOQODcGJ7bjavcw2hwftqcUTJBnQ=w1280-h720-no
https://lh3.googleusercontent.com/0MlqpcueM8SSqe3S-1mY1JGHuuJhtP71svXld4awvZiaHNG4pqlYnL6ol31uWyeDgNx-tvVHDZtpIX_EaYa1mXV0lW_7qcygE9rcYi9g0gmi4ySH85G17GWFGSH8TuIyIQ9tw4WaAKs1EMjOvTI1 A8g6VfWjhsx-woYsOWdy6fdfg6sZ_PDGoJmPNlBCSq0z4gJWfZdxhUY3Ln6HBVvHPC_w1YOdPqtnKwDemPfaIqGWQrMg TMtcKakg0rdGc2T5h1RLWz3WYnklHfRxn112iSDLiDqYxMsSJwMu3s8vqfsr3AT5PMqkNRK0Lx9E9htj vX4cXdb9f-2ZHaOMbzFMoFc9FAeNF1eBZ8-VvFg9RB8Akj-utgjewhnWmXXZ2LMywA5NoFRiDBbKn-JHQPSBsJ3ADui6gLrJyjjuzQ-aiGieEscsjJhmjsJgsu75WG3Ev5Zq0lA_bWTTL2bznqyWxNZ0k3cdw4EUkjTTxU5v-I-f-4XKOlqhkqcCpKCJsiqVubjwTvqSQnMlh1hLqODmqIBjm2yAh6cNWDB_5F4YpBfbBQGddUbu6tMo1h3qW 8q7b2q4us1N1FUwuV8RL5vsYYbXWQLJsJwtfxFALqNa4vcsY5NQvN1o8Q=w1280-h720-no
IchoTolot
2017-04-25, 17:47:27
Wenn ein Ryzennutzer das mal machen würde, würde das interessant. :)
BF1 skaliert bis zu 16 Threads, mehr habe ich nicht und die Graka bekomme ich damit trotzdem nicht ausgelastet, jedenfalls in FHD/Ultra^^
DqbQ8oIb8G8
WPcaFpr2Ov4
ssYIkjZwsoA
au9jcrS0aC8
Wobei die Zwischen-Ergebnisse eigentlich doch gar nicht wichtig sind, also von wegen HT an oder aus. Ich habe von 4 zu 16 Threads eine Verdopplung der FPS (an der Stelle wo ich gemessen habe). Und alle Zwischenschritte legen die FPS zu.
Also ist es zu 100% sicher, dass BF1 auf jeden Fall bis zu 16 Threads skaliert. Egal wie die Zwischenergebnisse tatsächlich aussehen.
IchoTolot
2017-04-25, 17:53:12
Interessant, das scheint dann aber ein Unterschied zwischen Solo- und Multiplayer zu sein. Konnte leider nur Solo testen. Dann wird es bei mir Zeit für Coffeelake. :D Naja, ich spiele ja kein BF1. :) Mal sehen wie weitere neue Games sich da entwickeln.
Weißt du was ich ohnehin denke? Diese ganze Thematik HT an oder aus, kratzt eigentlich nur oberflächlich schon immer an genau der Thematik wieviele Threads wirklich genutzt werden. Rawiioli hatte es ja getestet bei ROTR und hatte da mit 16 Threads dann weniger FPS als mit 7 Threads. Daher rührt diese Empfehlung eigentlich nur. Es hat scheinbar nur bisher nie jemand wirklich mal geprüft im Detail scheint mir. :)
Dann dreh doch die Details hoch?? ^^ Man will doch nichts verschenken. :)
Hast du Crysis 3 und Wildlands? Kannste das da auch mal testen?
Edit: Ist das dein YT-Channel?
IchoTolot
2017-04-25, 17:59:10
Egal wie die Zwischenergebnisse tatsächlich aussehen.
Richtig. Wenn ein 16 Threader langsamer wäre als ein 12 Threader müsste man es aber so machen und testen.
Hast du Crysis 3 und Wildlands? Kannste das da auch mal testen?
Edit: Ist das dein YT-Channel?
Alles drei JA, weiß nur nicht wann ich dazu komme. Und ich bin mir nicht sicher ob ich in FHD/Windlands überhaupt ein CPU-Limit hinbekomme^^
Schnoesel
2017-04-25, 18:18:41
Andere Engines machen das auch. Hier z.B. WD2:
https://s8.postimg.org/otank4llx/image.png
Und das ist Singleplayer, 1440p und Very High Details. id Software hat angekündigt ihre künftige Engine fit zu machen für Ryzen:
http://www.pcgameshardware.de/Spiele-Thema-239104/News/Entwicklung-gestartet-und-auf-Ryzen-ausgerichtet-1226443/
Heißt natürlich jetzt nicht im Umkehrschluss, dass ein 4C/8T da bereits Probleme hat, jedoch ist imo der Trend ganz klar ersichtlich. Zwangsläufig muss es über die Kernanzahl gehen. Takt- und IPC mäßig sind die Sprünge einach zu klein, bzw. ist man bereits Nahe am Limit. Ältere Spiele werden natürlich nicht von Mehrkern profitieren.
IchoTolot
2017-04-25, 18:22:16
Ja hier musst du aber differenzieren finde ich. Dass ein Spiel alle Threads auslastet ist keine Kunst. Bis zu wieviel Threads aber die Performance steigt ist die interessante Frage. Man kann auch mit mehr Threads weniger Leistung erhalten. Die Frage ist wann es kippt. Und das muss man dann Thread für Thread testen.
IchoTolot
2017-04-25, 18:27:13
Alles drei JA, weiß nur nicht wann ich dazu komme. Und ich bin mir nicht sicher ob ich in FHD/Windlands überhaupt ein CPU-Limit hinbekomme^^
Ja in Wildlands hab ich meine 720p getestet und dann die Settings weiß ich aber nicht mehr. War jedenfalls schwer da die perfekte Einstellung zu finden. Irgendwo hab ich die Screenshots noch. Bis 8 skaliert es ja, wie wir wissen. Die Frage ist bis wohin hat man noch eine Steigerung, das finde ich spannend.
Hier hab ich es mal mit Wildlands getestet.
https://www.computerbase.de/forum/showthread.php?t=1663686&page=205&p=20010637#post20010637
Der_Korken
2017-04-25, 18:28:46
Das Problem ist, dass du nicht einen nativen Kern zuweisen kannst, nur Threads. Wenn du also "CPU" 1,3,5 und 7 zuweist was ja so HT-Kerne wären, werden trotzdem die nativen kerne genommen, was auch sonst. Windows unterschiedet da nicht. Warum sollte es dann zwanghaft nur 27% (HT) der CPU nutzen? Hab ich auch schon getestet und bin dadurch erst drauf gekommen.
[/SPOILER]
CPU 0 unterscheidet sich nicht von CPU 1, beides ist der gleiche Kern. Es macht also keinen Unterschied, ob du nur 0 oder nur 1 zuweist. CPU 1 ist nicht der 27%-Rest von HT, sondern ein kompletter Kern, falls CPU 0 ungenutzt ist. Wenn du also 0, 2, 4 und 6 zuweist, ist es das gleiche als wenn du 1, 3, 5 und 7 zuweist (oder was gemischtes wie 1, 2, 5, 7).
Wenn du 2C/4T testen willst, dann weist du halt 0, 1, 2, 3 zu, wenn du 4C/4T testen willst, dann 0, 2, 4, 6. Wenn du fünf Threads testen willst, dann müsstest du entweder 3 Kerne zuweisen, von denen zwei zusätzlich HT verwenden dürfen oder 4 Kerne, von denen einer HT verwenden darf. Das heißt, dass die Anwendung quasi "ungleiche" CPU-Kerne bekommt. Wenn sie dann z.B. fünf gleich große Arbeitspakete erstellt und zuweist, dann müssen einige Kerne doppelte Arbeit verrichten und andere langweilen sich. Das meinte ich mit "schiefer" Konfiguration.
Schnoesel
2017-04-25, 18:30:14
Es ist immer einer Unterschied zwischen Skalierung bezüglich Mehrperformance oder Auslastung. Es kann durchaus sein, dass eine Engine keine Leistungssteigerung mehr aufweist ab einer gewissen Kernanzahl weil sie einfach die vorhandenen Kerne mehr belastet. Für die Zukunft gesehen habe ich in diesem Fall einfach mehr Headroom über als eine 4C/8T CPU (sofern die Software das eben mitmacht). Höhere Auslastung bedeutet ja auch, dass weniger Potential übrig ist. Auf lange Sicht gesehen geht daher nichts über das + an Kerne. Mich hat es im Übrigen auch überrascht, dass WD2 hier bereits 40% meiner CPU auslastet. Und das ist Stand Jetzt.
IchoTolot
2017-04-25, 18:34:32
Mir ist klar was du meinst, aber es ist nicht so. Sieht du in meinem Screenshot, wo ich jeweils mal verschieden zugewiesen hab 4 Threads.
Öhm..Ich glaube ich hab was falsch gelesen oder so. ^^
https://lh3.googleusercontent.com/0SjQsFenZYajl3Ol6JqeKdLs5X-D8ZlZ2JcrJKVtoKO0-DwBn4Q_aNMB3rQ1w6N9tRjIhIyBqk_7nz58nLtuBs3EXcBegzhqNeHSt1xyFUCHIUuuh3SnPRDUDNGCg-bDPTUzBCHEH4UHYJteNBBRBkfxOo1Xq1PMh_BpuTaPhYxnGsCWED4s6UL5nkGq5eEMBiAfXgsztJd3OX 3BnS0ScjGi0SRotbGccoI5jQ2G_wdyXf3UDxcqQN7EdI988M0tPmYa440W47UT-4Psfqy0kZoldYLH419TwrIEJKNMHxbIVAK_pyAzZjTBNVMf180p9B1P291qOC8_jZ6cghFk_9tBVWuoB qWsKmoWeyyAk-xw4XCxLo--b_qgObB6YSd8FdFcfDhgQ1oHaio9UJJN6UxRteJNNE1PfZmQjrnPyuZ6atde-JjnnwBkC73eSQI1W8f30XNKr35QZo4l_KJaHdBEcZjXZwRNj8AMTTv1OBXzFbm8UCnqe6zCnLOjr7Sze AL67Vby1P82ezq1kCW6KPPjzrBnDQZaQKHDdglgSYyoOkAwEZwVpR6yF3LmnEo_Dzua0KkrjPzNEF3--edU6rjxFzGatHLNKQKaGhfb47HyFKW-U7aQIA=w1746-h983-no
https://lh3.googleusercontent.com/jNq_q8CZKpCBrF1wjUyx48fcXHSK4_C-8DdDz9tMIXNcr3XTTZ0fvPLEYB5IVH-XGDW7PbKJgXztfytU52FVkS9P9BYs4oGRuM2KVJOwY9HDz9yb_VWWEfKBVXHvZ9vVBTFjX4xFeVX1AGX BoItlQD1iF-GwjtqgK69IPvbVUEHgDhGiWPDW26y6kukvIzblndofslBcEFkicv8AmzUmQBrPHe4dZoEUDsQxZE9IPa 21moRr98kSo0Y114THrcc561DT0wO7w6kOrB0aFC_0BgwqKIqeHr4YFQX6zO6r93b-bC9JH3ZfItS25FMUNGEF_lfFGUuSdPwei-4yKU1ZjN-eKA8zma9XnDajBSGrEihHk8M3gSvu5fIld0QQ1QhR6bMxoVorT_h0Prd24ZY6HZOlOZ90At06sVzKY9Y eu7aKLXYLqyiz0bKiD85cLlG1kM8Kc-oV7tYEIQ6pSmX3YazTP0fGay4A25VJt0H1gZ5rpJhggMa7c5tCGP2bunHarnkajx7AbCXYgvezaKXrrE EySUrEFFpNwsKyDh_uydFyUwKgVW32Tuk-maa3eR70i4l9J8WGBlKjLF-zmo6mXXhgdAmwxHtrQ8EgXcn_6P37IU4Kmn3F6g=w1746-h983-no
@Schnoesel
Da hast du Recht. Aber wir reden hier vom Fall, dass man sich im CPU-Limit befindet. Wenn man immer im GPU-Limit hängt, hat man noch viel Reserven. Meistens hängt man eben im GPU-Limit.
Es ist immer einer Unterschied zwischen Skalierung bezüglich Mehrperformance oder Auslastung. Es kann durchaus sein, dass eine Engine keine Leistungssteigerung mehr aufweist ab einer gewissen Kernanzahl weil sie einfach die vorhandenen Kerne mehr belastet.
Watch Dogs2 ist ein interessantes Beispiel.
http://abload.de/thumb/watchdogs2_2016_12_22hiuhr.jpg (http://abload.de/image.php?img=watchdogs2_2016_12_22hiuhr.jpg) http://abload.de/thumb/watchdogs2_2016_12_22hxusr.jpg (http://abload.de/image.php?img=watchdogs2_2016_12_22hxusr.jpg)
Unterschied 8 und 16 Threads. Keine Mehr-FPS auch wenn die Auslastung aller zusätzlichen Kerne 70% und mehr beträgt.
Als würde die Engine erkennen dass da noch mehr Kerne vorhanden sind, und einfach zusätzliche Elemente ins Spiel bringen.
IchoTolot
2017-04-25, 18:47:57
Genau das meine ich! :)
Das ist aber eine ziemliche Hypothese mit dem mehr an Elementen. :D Kann man auch einfacher an anderen Games testen, wo man nicht so viele Objekte und NPCs um sich herum sieht. Rawiioli hat es ja bei ROTR getestet und da saß die da auf einem Ast. Was soll da an zusätzlichen elementen noch kommen? Ameisen? :D Nee, Windows oder das Spiel beschäftigt da unnötig die Kerne denke ich. Und das muss man mal genauer untersuchen.
Denn: Benchmarks würden dadurch ja auch verfälscht! Da ist dann ein 8 Threader schneller als ein 16 Threader oder so, weil das Spiel eh nur 5 Threads unterstützt oder so.
Schnoesel
2017-04-25, 18:54:45
Als würde die Engine erkennen dass da noch mehr Kerne vorhanden sind, und einfach zusätzliche Elemente ins Spiel bringen.
Das ist wiederum die Frage ob das der Fall ist. Es ist schon sehr seltsam dass die Threadlast so steigt ohne, dass die die einzelnen Threads signifikant weniger belastet werden, obwohl nun doppelt so viele verfügbar sind. Und welche Einstellungen sind das die die Last auf 70 % - 80% steigen lassen?
Grundsätzlich bleibt die Frage was die Zukunft bringt. WD2 ist wohl ein eher extremes Beispiel dass auf Kerne steht:
https://s10.postimg.org/lnowhih8p/image.png
Andere Spiele wiederum ziehen gar keine Nutzen daraus oder benötigen einfach nicht mehr CPU Power:
https://s12.postimg.org/8wbabjun1/image.png
4 Kerne ohne HT/SMT halte ich aber für nicht mehr zeitgemäß.
IchoTolot
2017-04-25, 19:36:44
Mich hätten die FPS hinter den Auslastungen mal interessiert. Woher ist der Screenshot?
Gefunden.
Aber auch da geht man der Sache nicht wirklich nach und schaut was denn bei den verschiedenen Auslastungen eigentlich rumkommt. :mad::confused:
Schnoesel
2017-04-25, 20:03:50
Die avg FPS gibts da auch aber imo sagen die nicht viel aus. CPU tests werden aber immer noch Stiefmütterlich behandelt, da gebe ich dir recht. Interessant wäre eben: Threadauslastung, FPS und dazugehörige Frametimes.
Es gibt durchaus Spiele die nen I3 mit HT zu 100% auslasten aber nicht weniger FPS ausspucken. Da bin ich mir aber sicher dass sich dann bei den Frametimes größere Unterschiede auftun. Das natürlich für einzelne Games ist recht aufwendig wenn man jetzt noch unterschiedliche CPU Konfigurationen hat.
IchoTolot
2017-04-25, 20:23:44
Ja genau so! Das wären endlich mal vernünftige Tests aus denen man was erkennen könnte. So aufwendig finde ich das aber gar nicht. Man liest doch eh alles auf einmal aus bei jedem Benchmark, hat doch eh kaum Mehrarbeit.
CPU-Tests heutzutage sehen leider immer so aus, dass man einfach CPU A gegen CPU B bencht ohne sich die Sache mal wirklich im Detail anzuschauen, was genau da im einzelnen passiert.
IchoTolot
2017-04-25, 21:09:26
So, ich hab mal ArmA3 im Multiplayer mit 60 Mann am Server getestet. CPU-Limit ist da natürlich immer da, aber das kennt man nicht anders. :D Man sieht aber, dass bis so 5 Threads die Auslastung auf diesen recht ausgewogen ist. Bei mehr verteilt sich die Last dann deutlich mehr und der erste Thread wird tendenziell am stärksten belastet.
https://lh3.googleusercontent.com/x1hYXssCjGbDzgx1ftNW6FR6mVyWajQsGRemOpMqo-JJqV_GrnhJv9V2W8bvPpv40NRti3XNuSBTSIgAOCSzJubXtwsfJoHiJSKS_PHL-Ig7W5AH-h4A6-ghfW1pVgzw1FDR2MxgPSAfESqJEar5U-t3rRjDoWC_50OF0OkhHLYEeu9UBqMz7p7zfa9pc-pjrvB21VoQaXyY79k2cphbL8jIjg4bVOkzh7iTVsjVm3dnvN7hBlRQLKyl0Oe8H7XUgHdDrdo45pPXD-viFbHm9iWbpEWcDD1oM1wKsLw2bBy9-z2w1htO70YTxbAd-rGVLrFC0YFU04pz1rc9j1zenQIhuDXB35i4bHxakcgAPywCp5HPB5hjttKK_QF4LNhyMEYvnV3r8noWz mPCfyLxT6FEpfKLNBpA3X2vBaEHvY9u4ytlOb3G7M-H6RRv2mALvcnhz_ldZY1BAvz50lWx_3Kz-36kEuYTRm_wzlCc2OD1v19eUNIK9KmVb2sTNBpJmSsVDSk_EXJEKo1UXM9tP9p7smnwOWWsMYo-Kra582ALZDCa3dzKfnKq9PDxXNomepFNne6RK_P75AdDhgbEjjOBWM1yZeDd1Qx3UeIGc8JOLQVw1usy ZQ=w1746-h983-no
https://lh3.googleusercontent.com/XDar9RnHa58KIifn3CERD61lH7n4dIYvM3bhuwlrMfRDj0xfVWL34ilvPIxhr9Hshqe3pqOlmeY773-dvYCyGbgDSXmcaMNPRTJES-cn79Cp32R7_vMmCjgvYAgHPpMnv8fsT8bSoAVfaa5qxcT8w5wdMduGzigsyTVn_y5NT-cBCosln3TZd3yOip2ofsmnlD6ohndQdPyviHRhThOm2iXTArT-3jh6m-X9Ddx3-R36hEDEtPm79c-dSyJAIZg_M10fzE0PkVrKDgqn5_i004m02e5_YyfJUCScnGW6M6xaodJohTBG_4Y0eWjSQddRVXTatup WEfpNL2BgyCJg8YhcLy4rd1SA_mClQ_hs1H17L2XPdka0B_177piHHHl39k-K01AanU9HMFcHZ9mxzpezJ-kcGjLChW4wm208CpiWjM4f1WKFZ4xhUAWffN8-JZFD5yYUMVFP6oM3mXUvNHCcpqy8CjmSGdiCC-kmXN1xB0YzHbN-Ib7FwJJCfHhVsm6wyLCAMR6qqUxohrUxyLxuQRFCXqgJxR0rTdY335DBHa-n1YZwP9oJjLYp5rVzSiThXBXkEORMajmwgq9yzzrDMp1RA9_5lTFg2lJMm8H8PAuQrYSNKA=w1746-h983-no
https://lh3.googleusercontent.com/oWk_oGW7t2-kAnlL2zs-8js_Pl5yLS-pDSjSYovuUVfmGt3L2nLs7WHHDa22ynTSuC0BGEWslL7EMM4rDjpVUvekkae9l2NGAPaTwxEag1hspCU 9oqZzPQDrl58S07jg5yt6qoAITQIdBtD43tgOXv_w62xmjkMXv3LuHVI1hL3QtFQFaX88pkZY7CbQyYI uCAaOD0liYhujzxsNOHAgTTo_VJUU1peaX4KrCfzvmjPLP4SUZiMZ3cGPGqL7Yf1BPVb7huflz4kYgJr izo5MsRxnXQ9KXE8LOoN2_aa2LHjJ-V0Xki0zcY5bvjpc7MHTsN_JFBfTQLrXGPJjW3JwzLROYSR9nIzxHFL9OT68mHXkQqltcaMJU9v30tLEB fNg6qtGu29LfVxLmxL0O2hOj0QCK4_Ts0oIS5QqzBCem4oC9U4sQED8CbgxRv_5P04zWOtI21aQhbxEY O5po2gSr_WTVEkHFXfGCUh2pXfO8g2BcFH9zLX7v0cIcLA0NkQy7JJqmborhfwpS12-6AA9pqOgzHeRNdBqKCx0auxsvdUPlZDasrVGwNrkc3lM1_LQr9dEs6Zla44BnnYPM5LOJNQfoaBauohx RFPu7vo9j_jLZPwSnTVkAg=w1746-h983-no
https://lh3.googleusercontent.com/_Jx2RH-t8_V2fZMOBHmBXHJCDxY60YmtpuEzBvcWEagt6Fa8rjBvbTeo8VYhwspsDiyTH0oAFpJ-_V_TR5pMUcFYUMMWtzK7S8qKKENngFdYCuDAhCQ3vKjlTjB9g40Wc1N9mAXhffEJ8qyBmuObLuxWxrtS WCsq7HykrgQXrphgqPyoYhvACTe0bj-JEsIa21TnN5-TutTuDXxy-ksQ4zQZF-4MO0hXcMkA5zySP7kBtp6xhvkUDpZIoZyRJOGblpG037TuLKe2VzCp4tXcBH22ldo66_tHHawiyyq6BT uqnsnnnxsHMOQaHRbdUMy8tHHXsoVKbhFQbV4Kanzb6Ml4YHXDss9VcV8kbDuScTAqbLHTlVcrw-omfxVpLv7AztwbvjA80-nmmDOk1Mr-up8M7Y38PoqbMLUk9Ma0cqPZGQqjidJfhX2-sJuP2xCcYDLRfML01bIhTwzY6yn7MQwblhA9txFP6akOfHdi9kBApYmPYvNsoVLlfT_Hzs-XMtpTXt5QSQigLafhV3W6U2TVG_t4rBR7L8EcqmRqkNYikzjD82MBV4YQBaxquZcAokOh0OHAZEogERc kbYSTfU_uV2wW0uS3pTiatwiKqgbsjMdyvJyTkw=w1746-h983-no
https://lh3.googleusercontent.com/jwNH4c3XIsaUbcE_i036grVhrYoEwgj3S4egSZGgR-toNbVpCnNECFBYuz35GsPUwDK-aywissbuIILzTJaK_g2jZKzEkI2Yv2jp5glKHcbX6M8rO7EnXmV7TLiTF2Wr1iFBbkB3-UGYTwSda04M3C0JCMsuLGehQxt9TAuBi-TU4cM_9yDmUc8SinD-Y850eHAUY3mLp-IwnVuugILopwJPW7ZLtW7EnfGhagm_wAIZQHMK7PCbeGJdf-tvZlSGXa9o_Y0VQxTDcSIJ3EQjxHZV_oU5VeCKcrwe5JUb4-Y1-C5Dr6N25D-QoxaGe9j4_i9JoSGzZdomFuY7lSA7HVf_QmHFN4_oe2xN8dM5pT_YjzXE2FRW6_8G_DajAmaZTQJRZAe HSyw8fXVcqhnDymNpFsWFb6zug3AzxHOsZIkLZ4tEjHVq9M4H3mJ8CDeYXRkMU-jBIknhkZXF1apA_gbYHAoqXZpZZ9oO12DvZv1GCBxt1-jFiKngh_UmGLgSWckSsZnncQpPFwALx8acmwIZ45GYgBu7Ob9zSFhBwsxizAthHGGJlUnLD1xzFb-1KJ1nMaI0Cv-wQAQMJzuNaYdQpQkLv-QAgldjzdsIigCKhGyeJYQxdQ=w1746-h983-no
https://lh3.googleusercontent.com/P4avHQP0vZlr8oce8v1C1FwUjqD4LTV6nTAmZgMUqKwYr0IbyeRBeRNb-K8uC2b5E7dqpIbgC7mQHos59O18DswfOIm11DumYhY6dYCo_XPg6fRUCpApfx7jL_b-wmI9aGQDXshWRa84dxKzFwRzFNPFhKgBCyJpvwR-j4g6BvD_POGadYCF5ozjXCHypEaJGgb7W4pQLlZMG36bxLOo51kR8E5CgQA9JT8INsCAw9fhVqEdkV1c rmdjq0MRhDwi1vv4cHmKkmRWM41N2AMbXwfGCnwQeCuiH_btGfVPQbjHJKf5YfvIHPEfB07e2HFZ4ORX Q21KO58mYbNR7j0WJMsCKW_Pz0_4EFOxmQiPd5u-IXlD1umOMEuIIZxvswQT0xi5UmCpahDjXrhi2B985Q7-OaYnChfQelGutfhsbjIV9BPCcCZ6YapRTysRZ1FMTj2XOKIyJKhSi6m6MDw6jg6_0JJ_I14_e4dV6-MykBVxx4QCuV0zEAXgIZueHOpQp--ZfO1cGtwb7fTVVARVRPUsRKAyIGFxGRYKr4f1RtlsLad4j-gg6BP6hzEj_nsTEMuttkn9wuzvbImsSAUcXems-0HdHaa7Fp1YDI73hmCmC_m5LcQYRA=w1746-h983-no
https://lh3.googleusercontent.com/NdGL98n3fUg7eCyL17-wTLOO0XxK92Qwz9rLBS_H5KPms7mWMiuKBV65WYvjS1wZJ96THi-jguAFFl41uajdRoNzUdvDBgl_u5wCHdmpj4uIfRkKFhXXBgUtT0tBWVKFX0hv5JgBM3iGvWP2rqWlrV5 9hbfOS4oYB2JxCD7igAxW6xJlDqvbwdIsCbY3NAZD1P8-vCwol3onlu-thFYS04XshwlI6ufKRXwk4qldFOszQVSGalq08AySVMbTpFGM3W28-m4-F1_kejjQ7_hMt1LcBgOGBj1gWRp3h5CE5A4rGt2wnUCiIpVPu9lhQ-fH7z9-L3Vc0cVTLWLnJlit7Q-SFyl_zns9ivHRRxj6gG8YS6N-VbuXlRhVyJJFQOeiEdERzIjbZpUmuBUrbrDD9nezRG6wClefjlt0pC1BGOVjU2Pj7Uc4AkXvDTCiKNgy QwUesc1N3LrM5T2SFcLRfQIOEd7HesHjbc1T2l-TuF_hJX-wvDAiFmuKueV9RQuMsUhfYUbk9Rb2Zc-Qaaktd6dn8WsHpfV4UjywLy2eoc3_Ct8s2VfPgZFt4Afk-NnwSJgFZCOxjW4eh58U9BtYlPasAI26n1IrEfAh3WYGznJ4mKFMiCo4xQ=w1746-h983-no
https://lh3.googleusercontent.com/U4OFKLosbka0DAXwMIYGhb4KU0bqm1sTcHLDF3zxLUWKnAiERObp-ivOQ6XNs9xTPC-Z7GtmOjS40G9ZixZ6VUTCZM4hKipJiv1n6DBTBe0KAVAkyZvsdRY1G1RTbvjL1_RCmvgnjvTS1_99hvx rd2zqe11Y8w1yESil0QsUfI3OGW64xJksYR-oupK7WkORN719-WTxs16Y0DD7EhVjHyeGToiWHGMRABDeFmvW_9zbyzdWulEK0vsx0Hk8E0mCCK-8YE0unjmnq-fHpRUILWKPLd7iJUUOAZkJlBf5mYKeJcDYcoiqwwW8qpkrBIkKbeYG5X8iYVxXEo2Z0NVEC-cUlyRLJFnv3kAcffwVcSYVCIRzk3JAlBQ5OYkNUHVyQye-wtABCYr71fI35vL0DneO3ABEaWkC4JL7PriSXkKEM2PzOBxt2PfgA2uu1hv6dcKgm1VUvx67WEOHAt9G ZYtKYBMDqcCxhJmGCxAurnWAk1WuLFybdLOX5GZtNE1syUupmy2IGtK6u1WJdFHWGKrl8QaxVLOyUdbl wu5a-5O0yuw0sm9eHl5eQj0DnweCnEXtA8xcLy3ACBvtdTE7px_TjErmWhvkKUqp9VDx7E8l_SppPUAlWA=w1 746-h983-no
Wir wissen ja alle das ARMA3 "nur" 3 Kerne benutzt. Und Deine FPS zeigen es.
IchoTolot
2017-04-25, 23:22:11
Die FPS kannste knicken, die ändern sich eh nicht, weil ich eh immer im CPU-Limit bin. Ich könnte aber mal den YAAB laufen lassen mit verschiedenen Threads, aber das ist was aufwendiger. Das sind dann vergleichbare Ergebnisse. ArmA3 nutzt aber definitiv mehr Threads als 3. Auch im YAAB nutzt es mehr als 3 Threads. ZeroZerp hat das ja mal durchexerziert.
https://www.computerbase.de/forum/showthread.php?t=1672767&page=4&p=19992440#post19992440
Gimmick
2017-04-26, 08:27:18
Watch Dogs2 ist ein interessantes Beispiel.
http://abload.de/thumb/watchdogs2_2016_12_22hiuhr.jpg (http://abload.de/image.php?img=watchdogs2_2016_12_22hiuhr.jpg) http://abload.de/thumb/watchdogs2_2016_12_22hxusr.jpg (http://abload.de/image.php?img=watchdogs2_2016_12_22hxusr.jpg)
Unterschied 8 und 16 Threads. Keine Mehr-FPS auch wenn die Auslastung aller zusätzlichen Kerne 70% und mehr beträgt.
Als würde die Engine erkennen dass da noch mehr Kerne vorhanden sind, und einfach zusätzliche Elemente ins Spiel bringen.
Müsste man mal mit echten Kernen ohne HT gegentesten. Hat denn keiner so einen schönen 12 Kerner oder so rumfliegen? ;D
OC_Burner
2017-04-26, 11:17:23
Ich hatte das bei erscheinen von Watch Dogs 2 schonmal mit DualSockel und zweimal echten 18 Kernen ohne HT getestet und bin wie HisN auch auf den Gedanken gekommen das die Engine irgendwie mehr Elemente in das Spiel bringen könnte. Ziemlich weit hergeholt aber von irgendwas muss die höhere Last ja entstehen. Allerdings steigen die FPS in geringster Auflösung ohne GPU-Limit mit wachsender CPU Anzahl immer weiter an.
2xCPU = 28fps
4xCPU = 63fps
6xCPU = 99fps
8xCPU = 115fps
10xCPU = 126fps
12xCPU = 130fps
18xCPU = 135fps
36xCPU(2x18) = 132fps
Gimmick
2017-04-26, 11:40:25
Und bei 18 Kernen war die Last auf jeden Kern so hoch wie bei 8 Kernen?
IchoTolot
2017-04-26, 17:33:13
Ich hab mal die Legende versucht zu widerlegen, dass ArmA nur 3 Kerne nutzt. Ergebnis: Es nutzt in jedem Falle mehr und ich bin nicht mal sicher, ob da bei 8 Threads Schluss ist! War selber überrascht!
Hab es mal anhand des YAAB (https://steamcommunity.com/sharedfiles/filedetails/?id=375092418) gemacht.
ArmA3: Low Preset + 8 Km Sichtweite + DynaSound Mod + Enhanced Soundscape Mod
1 Thread resultiert in einer Auslastung von 100% und Spielabsturz gegen Ende des Benchmarks mit Verweis auf Arbeitsspeicher.
2 Threads = 23
3 Threads = 33.9
4 Threads = 33.9
5 Threads = 37.1
6 Threads = 37.1
7 Threads = 38.6
8 Threads = 38.4
https://lh3.googleusercontent.com/X42nxKRZtt1WeDFCidUaNa8bh2Uc7gp3rZsQxPaeo5x0nmlTfvg0e2Vx_32JrfnTSNZ83ZZuVKApAaMr oZd2OzEok__Lye2VlbHL9h9vtCKl_dYM2biVOVQyEb0lcXR3jj3KKY5F2tTUGtAFe9946QudaGHc5KTI nXhyCTbGnCDGWwbrbXtLe06Wona6uNHcwvISZJPhXzPjhCqS5r2WENLoKb1EazV-4L4JZsdx8vKp3w2f-MONoT_D5TtVMiiULshHf49fEaQu60TCj62m3xsXRAFbOr4y1B9NO0CasJnr-Dlg1fq0mdJbey46myxTXQk4Z5d0hHjRNNn7FEiHtjDY4DGN_Mg9Sg6bxtbBwPXhXy6-H3RqVshnT6PInP6WEN__A9F9nyXsxKtR2bAyZRf5h2Uct1MzKrnKH1F_ZxD1c1atXd8B1BuqPX_P9Nef 4vhFnHVsEbAa6zFi3MHJSM_5gzpR_-mjfxGJg2PsWrfPxxjuN31CaDG1Uz5TMblAU_e2opZebx07eQ6pfuIVeyjnAFmJGFGAFkE9LnOTqpP1X5 7zAKCnebY7L9UihC8MtgHTNwTYob7uEqa96P26JGMAY7cEcdC7UqJ-BV002Gy1TQUbGscvUA=w1746-h983-no
Wenn jemand mehr als 8 Threads hat, bitte gerne mal testen mit den weiteren Threads wie es sich da verhält.
Gimmick
2017-04-26, 18:11:15
Ich hab mal die Legende versucht zu widerlegen, dass ArmA nur 3 Kerne nutzt. Ergebnis: Es nutzt in jedem Falle mehr und ich bin nicht mal sicher, ob da bei 8 Threads Schluss ist! War selber überrascht!
Hab es mal anhand des YAAB (https://steamcommunity.com/sharedfiles/filedetails/?id=375092418) gemacht.
ArmA3: Low Preset + 8 Km Sichtweite + DynaSound Mod + Enhanced Soundscape Mod
1 Thread resultiert in einer Auslastung von 100% und Spielabsturz gegen Ende des Benchmarks mit Verweis auf Arbeitsspeicher.
2 Threads = 23
3 Threads = 33.9
4 Threads = 33.9
5 Threads = 37.1
6 Threads = 37.1
7 Threads = 38.6
8 Threads = 38.4
https://lh3.googleusercontent.com/X42nxKRZtt1WeDFCidUaNa8bh2Uc7gp3rZsQxPaeo5x0nmlTfvg0e2Vx_32JrfnTSNZ83ZZuVKApAaMr oZd2OzEok__Lye2VlbHL9h9vtCKl_dYM2biVOVQyEb0lcXR3jj3KKY5F2tTUGtAFe9946QudaGHc5KTI nXhyCTbGnCDGWwbrbXtLe06Wona6uNHcwvISZJPhXzPjhCqS5r2WENLoKb1EazV-4L4JZsdx8vKp3w2f-MONoT_D5TtVMiiULshHf49fEaQu60TCj62m3xsXRAFbOr4y1B9NO0CasJnr-Dlg1fq0mdJbey46myxTXQk4Z5d0hHjRNNn7FEiHtjDY4DGN_Mg9Sg6bxtbBwPXhXy6-H3RqVshnT6PInP6WEN__A9F9nyXsxKtR2bAyZRf5h2Uct1MzKrnKH1F_ZxD1c1atXd8B1BuqPX_P9Nef 4vhFnHVsEbAa6zFi3MHJSM_5gzpR_-mjfxGJg2PsWrfPxxjuN31CaDG1Uz5TMblAU_e2opZebx07eQ6pfuIVeyjnAFmJGFGAFkE9LnOTqpP1X5 7zAKCnebY7L9UihC8MtgHTNwTYob7uEqa96P26JGMAY7cEcdC7UqJ-BV002Gy1TQUbGscvUA=w1746-h983-no
Wenn jemand mehr als 8 Threads hat, bitte gerne mal testen mit den weiteren Threads wie es sich da verhält.
Für mich sieht es so aus, als ob du wie folgt zugeschalten hast:
Kern 1 = 1 Thread
Kern 1 + HT = 2 Threads
Kern 1 + HT + Kern 2 = 3 Threads
.
.
.
Wenn das stimmt würde ich sagen, dass man sieht, dass der Gewinn pro Kern nach 3 Kernen, also 5 oder 6 Threads, sprunghaft in Richtung Messunsicherheit abnimmt.
IchoTolot
2017-04-26, 18:14:49
Nein, eben nicht. Das ist genau falsch. ;) Windows ist es vollkommen egal, welche Threads du zuweist. Wenn du 4x Thread 2 zuweist hast du die gleichen FPS wie 4x Thread 1. Windows nutzt stur die vier nativen Kerne bei 4 Threads und alles darüber ist dann HT. Wie soll das auch gehen? Soll die CPU dann nur 27% Leistung zur Verfügung stellen? Das ist bei KL die HT Leistung eines nativen Kerns. Hab das ja schon alles getestet.
Siehe hier in BF1:
https://lh3.googleusercontent.com/C5vkawwHkAcjdkrodIzmCQ-87y3pCOfp_rCRKn2KKtPrNyJpgUFifyQDHQbTLyUECtweI8ooHpv4pUAi9P4XUHT307TukuUzkvfWJV3 EVKoPgrjvaotglbSITZ81xLFX5sRM6fjIiCXhtNY3oD1SRNY1UA8gtsrW6I2t8OjCZHpe03p7jVOr1uz PFvPwT5qK__JB27PlKDrHG3L-Lo9KPOBCCZom6yAWA-hUb8yJ2ka60EDsbML9kTefvOEye2s5r2zcvsn_uLwCzYNb8Bm9SR9daDWLUiTYvenJnM11jvSvNyS1sa RyM-yT9uLzeKYQ0ikLOy5xcPAlX_HkecpsXAyVjdjwiGcniyn5COFAM8dMPBDQ7mrJMTPyWrbXnivbdqOAtZ 9NvmESIFmzFZ2g9n-bOOGJj9x53AWkl5q0A4vefUbQdjdi9EVIShnPhJsVeXFeyVC-rm37Ya12SBpqD2OqQMvidzVCnb1VuMNy2OuzMkNR_V_TUgCSGh9_jOFzcZwOeQEASppV7O_Wi4nnNHlC XeKsWHZacaPDqrna8lz3EWRI-aVzVGmG_d-Ou7v2SJh2Y5P7IpPehWM0wyII3kvJyaJ6VJ_3cIThTmuY9wBCU3ZvCwe8Xw=w1746-h983-no
https://lh3.googleusercontent.com/MU3oNgxeG5C5qJTeZc94-KXIXeOyKxzEcQ0Hy508lmW8ddD8bJC4rVoLlkUcEohggZ1X4caOdfBKOqHTpc5KPKm3FUXddANozyklw xPuYF-UmfHjSCvdlSKxLK_5BxvL-xQZzKTiz6B_skP176J24nZj48sA25FP9tDGlXnSXrzzFyy5rS4eyPf6jDQBVB2c1W_IMNKuytoQ_i3_s rKKankvtJ0DsA_Rf9HNCTZwdHkg2nJ92V5Iqlw8ljKNaISWVxFaHEt4qvhlxP85Fi3KaBIlCHFWXaz2F IbH499DUgklHdhU_Jk07je22t0kwsMvHIecKZg9on5qjnFoEXUt2p-Pat8wSejec3xoWRfq0yf97z_3mczs-GhEFb2xugHa7etxumMVFtmnP5vK0MUntPSKrv-KkSVI9TyRkqiZgxGIY9qMfS2iYbQ8RPjZnAig1os0JZbSKnTU9Qwe7yEDkyyvO9RMK28rVYM-w3NDa9aJJLlqcVbCRsxVIy_R84drXiupfdqVy8R6kd_y1vTouAtMtodidrW9jFxBSmS_JhGtsfy3cVDO AEwbOOv6NZSVrSfu1u7LocPkm7RzDPIWDDY9NCsVdm8ysHqHi72W0S5H-ivTwAeV0w=w1746-h983-no
Gimmick
2017-04-26, 18:44:08
Nein, eben nicht.
In irgendeiner Reihenfolge wirst du Threads zugeschalten haben. In welcher?
IchoTolot
2017-04-26, 19:38:58
Von 0-7 der Reihe nach.
Gimmick
2017-04-26, 19:47:16
Von 0-7 der Reihe nach.
Also so, wie ich geschrieben hatte.
Von 3 auf 4 Kerne quasi kein Gewinn mehr.
IchoTolot
2017-04-26, 20:06:21
Nein wieso..? Windows und dem Spiel ist doch völlig latte ob das Kerne oder HT ist, das sind Threads erst Mal. Und wenn man die Performancegewinne sieht, dann würden die nur bei echten Kernen stärker ausfallen als bei einem 4 Kerner, der die Threads dann auf den Kernen nochmal verteilt.
Der HeinZ
2017-04-26, 20:17:30
Müßte jetzt nicht die Frage kommen: Wie sehr hängt das ganze vom Grafikkartentreiber ab, mal abgesehen von der API?
Z.B. kann es ja auch sein das das Spiel zwar einen nutzen aus den zusätzlichen Thread zieht die GPU/Treiber aber nicht. Wie sehr ist das wieder Hersteller abhänig, welcher Hersteller/Treiber handhabt das bei welcher API wie?
Nur so eine Idee.
Gimmick
2017-04-26, 20:32:14
Nein wieso..? Windows und dem Spiel ist doch völlig latte ob das Kerne oder HT ist, das sind Threads erst Mal. Und wenn man die Performancegewinne sieht, dann würden die nur bei echten Kernen stärker ausfallen als bei einem 4 Kerner, der die Threads dann auf den Kernen nochmal verteilt.
Du erstellst im Taskmanager keine Threads, du weist CPUs zu. Die CPU meldet mit HT aber pro Kern zwei logische CPUs und die Numerierung entspricht diesen logischen CPUs.
CPU 0 und 1 -> Kern 1
CPU 2 und 3 -> Kern 2 usw.
Wenn du jeden Kern nutzen willst wählst du entweder CPU [0,2,4,6] oder CPU [1,3,5,7]. Nimmst du CPU [0,1,2,3] werden nur zwei Kerne genutzt.
Wenn du jetzt von 0 bis 7 anwählst, hast du bei deiner Liste ab 3 Threads keine Steigerung mehr durch HT und ab 3 Kernen auch quasi keinen Gewinn mehr durch Kern 4.
Darkman.X
2017-04-26, 20:36:37
Dem kann ich nur zustimmen. So ist auch mein Wissen bei der Zählweise der Kerne. Bei einigen Spielen/Programmen kann man manchmal auch sehen, wie laut Taskmanager nur jede 2. CPU belastet wird, damit sich die HT-CPUs/Threads nicht auf dem gleichen physischen CPU-Kern in die Quere kommen und sich gegenseitig Leistung klauen.
IchoTolot
2017-04-26, 21:01:48
Ok, habs getestet, ist scheinbar wirklich so. Aber es ändert nichts daran, dass bis 7 Threads eine Steigerung zu erkennen ist. Thread 8 kann Messungenauigkeit sein, weil zu geringer Unterschied.
Gimmick
2017-04-27, 09:10:52
Ok, habs getestet, ist scheinbar wirklich so. Aber es ändert nichts daran, dass bis 7 Threads eine Steigerung zu erkennen ist. Thread 8 kann Messungenauigkeit sein, weil zu geringer Unterschied.
Hoffe du bekommst das hier nicht in den flaschen Hals, aber die Aussage kann man so mit den Werten nicht stützen.
Bei den Messungen musst du beachten, dass man schlecht abschätzen kann was HT bringen könnte und daher am besten über Kerne getestet werden muss.
Du müsstest also der Reihe nach so vorgehen:
CPU 0
CPU 0,2
CPU 0,2,4
CPU 0,2,4,6
Dann kannst du eine Aussage treffen wie das Spiel mit bis zu 4 Kernen skaliert.
Danach
CPU 0,1,2,4,6
CPU 0,1,2,3,4,6 usw
Da der Gewinn pro HT-CPU aber geringer ist, kann man so nur abschätzen, wie sich das Spiel mit mehr Kernen verhalten würde. Aber man sieht immerhin ob HT was bringt.
Danach könnte man noch schauen wie sich das Spiel am kritischen Punkt mit HT verhält.
Also wenn die Leistung z.B. bis 3 Kerne linear nach oben geht, was passiert bei 2 Kernen + 1*HT und 2 Kernen + 2*HT.
Kartenlehrling
2017-04-27, 09:18:06
Hollyshit, ein 2017er Game Outlast2 ... i3-4330 killt R7-1800x mit Singlecore.
http://gamegpu.com/images/stories/Test_GPU/Action/Outlast_2/o2_proz.pnghttp://gamegpu.com/images/stories/Test_GPU/Action/Outlast_2/o2_amd.png
http://gamegpu.com/action-/-fps-/-tps/outlast-2-test-gpu
Gimmick
2017-04-27, 09:38:51
Sieht nach einen 2-3 Thread Spiel aus. Auf den Konsolen ist das denke ich besonders ungünstig.
THEaaron
2017-04-27, 09:45:05
Dafür scheint das Spiel allgemein nicht sehr an der CPU zu hängen.
Schnoesel
2017-04-27, 09:49:59
Hollyshit, ein 2017er Game Outlast2 ... i3-4330 killt R7-1800x mit Singlecore.
Wundert mich nicht. Laut Grafik wird beim Ryzen noch nicht mal der Kern belastet sondern nur der SMT Thread. Also falscher kann man die CPU Last wirklich nicht zuordnen.
OC_Burner
2017-04-27, 10:30:04
Und bei 18 Kernen war die Last auf jeden Kern so hoch wie bei 8 Kernen?
Nein die Last je Kern sinkt mit zunehmender Kernanzahl, dafür aber wie schon gesagt steigt die Gesamtlast.
2xCPU (http://www.grafik-feti.de/ftp/Pictures/something/WD2_CPU02.jpg) = 5% Gesamtlast
4xCPU (http://www.grafik-feti.de/ftp/Pictures/something/WD2_CPU04.jpg) = 10%
6xCPU (http://www.grafik-feti.de/ftp/Pictures/something/WD2_CPU06.jpg) = 15%
8xCPU (http://www.grafik-feti.de/ftp/Pictures/something/WD2_CPU08.jpg) = 18%
10xCPU (http://www.grafik-feti.de/ftp/Pictures/something/WD2_CPU10.jpg) = 21%
12xCPU (http://www.grafik-feti.de/ftp/Pictures/something/WD2_CPU12.jpg) = 25%
18xCPU (http://www.grafik-feti.de/ftp/Pictures/something/WD2_CPU18.jpg) = 33%
2.3GHz Basistakt ohne Turbo, GPU Auslastung bei ca. 60%
Twodee
2017-04-27, 11:07:14
Wundert mich nicht. Laut Grafik wird beim Ryzen noch nicht mal der Kern belastet sondern nur der SMT Thread. Also falscher kann man die CPU Last wirklich nicht zuordnen.
Die Wahl des logischen Kerns sollte doch keine Rolle spielen, sofern nur ein heavy Thread auf dem physikalischen Kern läuft.
Gimmick
2017-04-27, 11:17:42
Nein die Last je Kern sinkt mit zunehmender Kernanzahl, dafür aber wie schon gesagt steigt die Gesamtlast.
2xCPU (http://www.grafik-feti.de/ftp/Pictures/something/WD2_CPU02.jpg) = 5% Gesamtlast
4xCPU (http://www.grafik-feti.de/ftp/Pictures/something/WD2_CPU04.jpg) = 10%
6xCPU (http://www.grafik-feti.de/ftp/Pictures/something/WD2_CPU06.jpg) = 15%
8xCPU (http://www.grafik-feti.de/ftp/Pictures/something/WD2_CPU08.jpg) = 18%
10xCPU (http://www.grafik-feti.de/ftp/Pictures/something/WD2_CPU10.jpg) = 21%
12xCPU (http://www.grafik-feti.de/ftp/Pictures/something/WD2_CPU12.jpg) = 25%
18xCPU (http://www.grafik-feti.de/ftp/Pictures/something/WD2_CPU18.jpg) = 33%
2.3GHz Basistakt ohne Turbo, GPU Auslastung bei ca. 60%
An zusätzliche Details glaube ich aber nicht, auch wenn Ashes sowas macht.
Am Ende ists irgendein Verwaltungskram :D
Wenn sich ohne GPU-Limit die FPS nicht mehr ändern, kann man da denke ich ruhigen Gewissens eine Grenze ziehen.
Kartenlehrling
2017-05-20, 18:42:28
Hollyshit haben sie die Programierer von Steam Hammer in einen Russischen Gulag vor 15 Jahren eingeschlossen und den Schlüssel weggeworfen?
Im Jahr 2017 erwarte ich eine andere CPU Last von einem Openworld Survival MMO, vorallem >500€ Grafikkarte für 60fps unter 1080p? :eek:
http://gamegpu.com/mmorpg-/-%D0%BE%D0%BD%D0%BB%D0%B0%D0%B9%D0%BD-%D0%B8%D0%B3%D1%80%D1%8B/steam-hammer-test-gpu-cpu
Steam Hammer test GPU / CPU
IchoTolot
2017-05-20, 18:53:03
Die Frage ist doch immer, ob die Leistung eigentlich gebraucht wird. Ich finde es besser wenn wenig CPU gebraucht wird, aber das Ergebnis stimmt. Ist dir lieber ein Spiel nutzt sinnlos die Kerne aus wie bei WD2 wo es keinen Unterschied in den FPS gibt ob 8 oder 16 Threads aber die 16 Threads ausgelastet werden? Aber das Spiel ist wiedermal ein gutes Beispiel dafür, dass auch in absehbarer Zeit keine Spiele erscheinen werden wo 16 Threads wirklich gebraucht werden. Singlecoreleistung ist eben noch immer oftmals besser.
Die Seite hab ich mir jetzt auch mal als Favorit gespeichert weil sie scheinbar eine der wenigen ist, die der Frage der Kernnutzung vernünftig nachgeht. In allen anderen Reviews wird darauf kaum eingegangen, sei es PCGH oder Computerbase.
Kartenlehrling
2017-05-20, 18:54:25
Das kann man sagen wenn man über 120fps abliefert.
Kriton
2017-05-20, 20:25:06
Die Frage ist doch immer, ob die Leistung eigentlich gebraucht wird. Ich finde es besser wenn wenig CPU gebraucht wird, aber das Ergebnis stimmt. Ist dir lieber ein Spiel nutzt sinnlos die Kerne aus wie bei WD2 wo es keinen Unterschied in den FPS gibt ob 8 oder 16 Threads aber die 16 Threads ausgelastet werden? Aber das Spiel ist wiedermal ein gutes Beispiel dafür, dass auch in absehbarer Zeit keine Spiele erscheinen werden wo 16 Threads wirklich gebraucht werden. Singlecoreleistung ist eben noch immer oftmals besser.
Die Seite hab ich mir jetzt auch mal als Favorit gespeichert weil sie scheinbar eine der wenigen ist, die der Frage der Kernnutzung vernünftig nachgeht. In allen anderen Reviews wird darauf kaum eingegangen, sei es PCGH oder Computerbase.
WD2 hat doch mehr NSC eingesetzt wenn die Leistung da war, oder irre ich?
IchoTolot
2017-05-20, 21:11:58
Wo steht das?
IchoTolot
2017-05-20, 23:18:44
Ich hab eben nochmal das alte Wolfenstein The New Order rausgekramt und bin total überrascht wie sehr das die CPU fordert! :eek: Hatte das mit dem neuen System noch nicht gespielt. Auch wenn ich auf 4K stelle was dann noch mit max Details gerade so spielbar ist, ist die Auslastung recht hoch. In 1620p hab ich dann mal mitgeloggt wie das aussieht. Wieviele Kerne lastet Wolfenstein The New Order aus? Scheinbar recht viele? :eek:
Außerdem hing ich immer voll im CPU-Limit.
https://lh3.googleusercontent.com/96j6PStv1fYHxvX7Cl98QYb6DwfB6JhNGQbxjCnhDve6bDsy0sHkG8lSdlYXM2L3K1m0GcJz5cnmP0TS SkmByYEMv1WnVErOzjZiMlcveyjaRadde7tpsuWcIsfuUIgP9rTDLCx8rGO2acsBJs_Nw0FUavsMooTG KxrGfc5797bUXmjQ6acTjnbUFetdGY268YwrDyIHWN0nh2Xiv3viO3KQ1vHmSYYHJRCdpSrVp4i35mxo ka7sHWBekcDS9YbRq1AmeoXKKsHbdxhRvr0BiRKlQ0m5RLvvTn4mp8noPmqg1SxvHQOQqAGIxQ2zZs9_ GklmvrkK0yLybo665KKibEwoVnshr1cslbPilostMI6HGFR5X5rMRCWJOBK5NLb1ftUyi42dh0PP3wSH Ix6Dc1cBNnVUsLR2hJIZjq_cQTfsLhON2HT-MjNaeIyNwPeOMINZq-WrizFowggiw1xRMagkie0bs_6gUz8guDrluaNa7rnG1mYi31vW1SONZ2Rt91Ky3M2-wrsyDlA8-S2Vb-gBqExlpQPqII5lwmTTeu3TtkBlOMII2PoCtPayiyD3ufI700OY3ExARVH-QkkqPnATkHTpni2K83J-Xy4KiAgJ6g9dC9DGQQ=w1746-h600-no
aufkrawall
2017-05-21, 01:00:11
Megatextur ging arg auf die CPU und hatte auch viele Kerne genutzt.
Mortalvision
2017-05-21, 09:06:01
Ich seh am Handy Dein System nicht. Aber die GPU-Zeit unter 100% korelliert ja gut mit den CPU Spikes.
Kriton
2017-05-21, 11:26:07
Wo steht das?
Habe nichts gefunden. War das ein anderes Spiel? Ich habe (IIRC aus unserem Forum) da irgendetwas in meiner Erinnerung.
BlackBirdSR
2017-05-21, 13:11:48
Wundert mich nicht. Laut Grafik wird beim Ryzen noch nicht mal der Kern belastet sondern nur der SMT Thread. Also falscher kann man die CPU Last wirklich nicht zuordnen.
Zur Info:
Es gibt keinen echten und SMT Thread. Beide logische prozessoren sind gleichwertig. Wenn nur einer genutzt wird, hat er auch Zugriff auf den vollen Prozessor (- fix halbierte Ressourcen, daher minimal langsamer als mit SMT deaktiviert)
IchoTolot
2017-05-21, 13:18:35
Exakt. Wie soll das auch gehen? ^^ Es wird absichtlich nur weniger vom Kern genutzt oder wie? ^^
Habe nichts gefunden. War das ein anderes Spiel? Ich habe (IIRC aus unserem Forum) da irgendetwas in meiner Erinnerung.
Das war nur eine Vermutung die jemand aus dem Forum geäußert hat.
Hübie
2017-05-21, 13:33:26
WD2 hat doch mehr NSC eingesetzt wenn die Leistung da war, oder irre ich?
Was ist NSC? :redface:
TobiG
2017-05-21, 14:08:56
Was ist NSC? :redface:
Nicht Spieler Charakter :uponder:
Hübie
2017-05-21, 14:15:13
Ups. Haha. Ja klar, das ergibt Sinn. Da werden afair aber nicht mehr generiert weil mehr Leistung da ist. Ist rein von der Detaileinstellung abhängig. Fahrzeugmaximum liegt bei 32 gleichzeitig berechneten Fahrzeugen. So ein hardlimit gibt es sicher auch bei NPC.
Dishonored2 (Steam-Demo).
Profitiert ordentlich von 8 Threads, auch wenn ich mich arg anstrengen muss ins CPU-Limit zu kommen^^
zdZehhZnMjQ
70 vs 90 FPS.
Und auch hier .... aufeinanderfolgende Kerne geben tatsächlich einen i3 mit HT anstatt einen i5. Muss man wirklich "alternierend" auswählen.
v-5uzlE_YNM
Kartenlehrling
2017-05-21, 16:55:05
Um wirklich zu vergleichen muss man das aber über bios abschalten, das nur 2/4core anliegen für einen i3 vergleich.
Naja, der Unterschied zwischen
4 aufeinanderfolgenden Threads und 4 alternierend geschalteten Threads sind in meinem Beispiel gut 20 FPS FPS. Ich denke das kann man guten Gewissens annehmen.
Das ist wenigstens ein Test, den man nebenbei einfach machen kann, ohne ein oder zwei Stunden vor dem Rechner zu sitzen und im Bios rumzueiern sowie das System ständig hoch und runter zu fahren.
IchoTolot
2017-05-21, 18:51:27
Eben! Deswegen mache ich das auch nur noch über Taskmanager. Ist das gleiche in Grün und immer dafür Rechner neu starten über BIOS ist zu aufwendig.
aufkrawall
2017-05-21, 18:52:50
Hast du das nicht noch in Beitrag #125 als Unsinn abgetan?
IchoTolot
2017-05-21, 19:01:35
Nee ich hab eingesehen, dass tatsächlich ein Unterschied besteht welche Kerne man zuordnet.
Edit: Missverständnis?? HT Kerne kann man nicht zuordnen, da wird trotzdem ein nativer Kern genutzt, das ist doch klar.
aufkrawall
2017-05-21, 19:06:59
Ich hab jedenfalls auf dem 1700 8C auch mal bei ein paar Spielen die Zuweisungs-Methode zum simulierten Abschalten von SMT angewandt.
Bei statischen Szenen in 720p war das einzige Spiel, das vom Abschalten profitiert hatte, RotTR DX11. Beispielsweise BF4 MP hatte es nicht interessiert, und Crysis 3 lief ohne HTT langsamer.
Ich war eigentlich davon ausgegangen, dass die Situation schlechter wäre. So gesehen könnte der R5 1600 sich wirklich als ideale PL-Gaming-CPU herausstellen.
IchoTolot
2017-05-21, 20:01:44
Ja der 1600 ist schon ein sehr geiler Sweetspot, muss man schon sagen. Mehr echte Kerne wären mir auch lieber. So könnte ich ein paar Kerne mit Video Umwandlung beschäftigen und die anderen stehen für anderes frei. (y)
Kartenlehrling
2018-03-22, 10:57:17
Neues Jahr neues Glück, vor 4 Jahren hat Microsoft mit der Einführung von DX12 Multi-Core versprochen,
selbst damals war bei 6core schluss, sie haben damals sogar nur Folien mit 4core gezeigt. (https://www.forum-3dcenter.org/vbulletin/attachment.php?attachmentid=50141&d=1414844372)
Mehr als Sechs Kerne heute noch selten von Vorteil
Viele Kerne helfen, doch nur bis zu einem gewissen Punkt.
Aktuell skalieren Spiele bis zu sechs Kernen bereits mitunter sehr gut,
spätesten bei acht oder mehr Kernen erfolgt jedoch ein Bruch.
Da der Markt sich jedoch weiter zu mehr Kernen entwickelt,
müssen auch Spieleentwickler nun nachziehen.
Denn neben AMD wird auch Intel in diesem Jahr acht Kerne in den Mainstream bringen.
https://www.computerbase.de/2018-03/multi-core-cpu-games/
Ein "6-Kerne-Limit" von DX12, das damals als Gerücht rumwaberte, ist nicht existent, oder?
Ganon
2018-03-22, 11:30:48
Ich würde ja eher sagen: Die Konsolen haben 6 Kerne für Spiele verfügbar, also wird auch daraufhin optimiert.
Kartenlehrling
2018-03-22, 13:14:13
Was ist eigentlich mit "Warhammer Vermintide 2", werden da die CPU Threads nur unnötig voll geknallt?
qu3x^
2018-03-22, 13:42:20
Ich würde ja eher sagen: Die Konsolen haben 6 Kerne für Spiele verfügbar, also wird auch daraufhin optimiert.
Geht doch aus den Slides wunderbar hervor und war im Grunde genommen auch das Problem der PS3 mit deren 8 SPUs. Das wurde auch so schon vor der tatsächlichen Einführung so prognostiziert und mehrfach diskutiert. Ich versteh die großen Erkenntnisse zu den 6Cores darauß jetzt nicht.
Solange sich der Mainthread nicht auf mehren Cores parallel verabeiten läßt oder optimiert ist um nicht so zeitkritische ggü dem main zu sein, brauchen wir uns bis 2020+ keinen Kopf darum machen warum unter hardwarenahen APIs 90% der Titel nicht besser laufen sondern einfach nur einen Ticken schöner aussehen können bei gleicher oder minimal geringerer Leistung.
vBulletin®, Copyright ©2000-2024, Jelsoft Enterprises Ltd.