PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : IPC-Angaben vs. Realität?


Badesalz
2020-06-28, 11:38:47
Grüß euch

Ich hatte zufällig noch kurz im Hinterkopf noch die Geschichte mit dem OC der NB-CPU des Bulldozers im Kopf, als ich in den 7-zip Benchthread stolperte...
Das mit Bulli, weil sich dadurch klarer zeigte, daß sich bisschen mehr als nur die redisigns der Alus auf IPC auswirkt. An sich, bekanntlich.

Da gab es ua. den Effekt, daß man mit 2.4Ghz auf der NB Geruckel wegbekam oder allgemein Steigerungen zwischen 5% BIS 20% erlebte. Bei Spielen/Anwendungsbenches. Rein synthetische Benches diese Realität aber selten hergaben.

Ich hab also in dem 7-zip Thread mal gebeten, 2 Leute haben bisher mitgemacht... :rolleyes:, den Bench auch mal mit 1 und vor allem 4 Threads abzufeuern. Vor allem 4, um auch mal zu gucken wie sich die "KB/s" gegenüber dem 2500k machen.

Mehr Breite schlägt wie erwartet gewaltig ein. Absolut nichts dagegen :smile: Dafür, daß Packer aber angeblich immer sehr gut skalieren können und die Rechnerei in der Anwendung selbst durch kaum Nebenaufgaben gestört wird, tut sich da bei 4 Threads imho aber nicht gleich soviel durch IPC (TAKTBEREINIGT) wie man CPU-Generation für CPU-Generation behauptet.
Imho. Könnte ja noch sein, daß ich die +IPC irgendwie grad falsch in Erinnerung habe.

Es ist ja immerhin nicht nur ein 6600k dabei, sondern auch ein Zen2 mit einem Win10 Build, welches bei der Threadverteilung, zwischen den Domänen bereits gut unterschieden sollte (?)

Ist das irgendwie zu erklären? Liegt es am SONST unrealistischen Workload von 7-zip? Oder am zu realistischen, diesbezüglich? :|
https://www.forum-3dcenter.org/vbulletin/showthread.php?p=12191044#post12191044

p.s.:
Vorerst hat mich das kurz an AVX() erinnert, mit dem man schon penibel aufpassen muss, denn sobald im System mehr als nur Desktop + Routine los ist (aka nur x264 benchen & Co.) und einem mal die Datasets aus dem L2D immer mal kurz weggeflusht werden, man damit dann spürbar stärker einbricht als mit SSE (das dann vs. Intels Folien wieviel schneller man mit AVX sein kann ;))

y33H@
2020-06-28, 11:46:49
Ich kann dir leider nicht wirklich folgen, aber ja, ein höherer NB-Takt bringt vor allem bei Spielen und Packern was.

Rooter
2020-06-28, 11:51:30
Bei Packern bringt doch eigentlich alles was:
Mehr
- IPC
- Takt
- Threads
- Speicherbandbreite

MfG
Rooter

Badesalz
2020-06-28, 11:57:40
Ich kann dir leider nicht wirklich folgenUnd wenn du nur den 4ten Absatz nochmal liest? :|

DoomGuy
2020-06-28, 12:03:50
...dann wird es nicht wirklich besser :freak:
oh hell no...

Badesalz
2020-06-28, 12:07:54
Hmm... Sicher, daß es am Text liegt? ;)

Screemer
2020-06-28, 12:09:54
leider ja. ist aber ja nicht wirklich was neues.

Badesalz
2020-06-28, 12:12:46
@Screemer
Dann ist das wohl so. Das gewohnte Schicksal des Einäugigen unter den Blinden ;)

Rooter
2020-06-28, 13:25:30
@Badesalz: Ich wurde aus deinem Schrieb auch nicht schlau. :D Habe nur y33H@ geantwortet.

MfG
Rooter

Fliwatut
2020-06-28, 13:26:53
Das Mehr an IPC kannst du so nicht herausfinden, dazu müssten alle Benchmarks mit dem gleichen Takt durchgeführt werden. IPC=Instructions per CYCLE.

Tesseract
2020-06-28, 13:45:30
außerdem ist IPC kein fester wert sondern hängt vom task ab. auf diese weise findet man höchstens raus wieviel die IPC in 7-zip mit diesem algorithmus zugelegt hat. diese erkenntnis ist zwar mehr als nix aber definitiv nicht allgemeingültig.

Skysnake
2020-06-28, 16:07:40
Bezüglich IPC kann ich nur das roofline Model empfehlen. Daran kann man recht gut ablesen wieviel IPC eine CPU bei welcher Datensetgröße schafft. Also je nachdem in welchen Cache das Set passt, also die innere loop die die Berechnung bestimmt.

Aber auch das ist nur nen bestcase.

Wenn man Divisionen oder Exponenten sein hat, dann ist die IPC immer um Faktoren niedriger, weil die halt komplexer sind und der throughput schon niedriger ist.

Aber ganz allgemein gesagt sind 2-10% von Peak schon recht gut...

Screemer
2020-06-28, 16:15:25
@Screemer
Dann ist das wohl so. Das gewohnte Schicksal des Einäugigen unter den Blinden ;)
war auch nicht böse gemeint.

Lowkey
2020-06-28, 16:19:28
Thestilt war damals überrascht, dass AMD ohne Grund einige Teile der FM2 CPUs deaktiviert hatte. Ein echter Vergleich mit sämtlichen Features wäre heute anders ausgefallen. Möglicherweise trifft es auch auf die Vorgänger zu?

PS: @Badesalz: sehr anstrengend für einen Sonntag.

Badesalz
2020-06-28, 20:37:07
Das Mehr an IPC kannst du so nicht herausfinden, dazu müssten alle Benchmarks mit dem gleichen Takt durchgeführt werden. IPC=Instructions per CYCLE.Warum wäre es nicht zulässig die Ergebnisse der höheren Takte, um eben die höheren Takte prozentual runterzurechnen? Wahrscheinlich würde man z.B. dem Sandy da auch noch Unrecht tun, weil linear skaliert das auch nicht. Aber erstmal egal.
Und trotzdem wäre es nicht ok?

@Tesseract
Das war mit ein Teil der Frage, ob ein Packer nicht eher zu den better cases gehört und die IPC dann "allgemein" - ergo, meist in real - nicht noch niedriger wäre als bei 7-zip Vergleichen (?) Grad die IPC nicht bei single thread ist beim Packer doch näher am Idealfall als bei sonstwas?

Immerhin wird das sonst überhaupt nicht hinterfragt in den Threads (oder sonstwo), wenn irgendeine Folie oder oder ein Twitter-Account eines HW-Entwickler von sich gibt, IPC konnte von Tick zu Tick um bis zu 12% gesteigert werden (nur ein Beispiel).
Dann läuft sowas in "kommende CPU xy" Threads rauf und runter und KEINER äußert anschliessend diese Bedenken und Vorbehalte diesbezüglich, wie sie nun auf einmal in diesem Thread auftauchen. Warum nicht?

Tesseract
2020-06-28, 21:07:14
Warum wäre es nicht zulässig die Ergebnisse der höheren Takte, um eben die höheren Takte prozentual runterzurechnen?
weil sich die relationen ändern. höher getaktete cores haben z.B. weniger speicherbandbreite und höhere speicherlatenz pro clock cycle.

War doch ein teil der Frage, ob ein Packer nicht eher zu den better cases gehört und die IPC dann "allgemein" - ergor, real - nicht noch niedriger wäre (?)
kann man nicht verallgemeinern. zen 2 ist beim packen ungewöhnlich stark, die sprünge sandy -> haswell -> skylake hingegen sind z.B. in spielen (sofern wirklich ein CPU-limit herrscht und genug threads da sind) eher größer als beim packen, besonders bei den unteren quantilen.

Immerhin wird da sonst überhaupt nichts hinterfragt in den Threads (oder sonstwo), wenn irgendeine Folie oder oder ein Twitter-Account eines HW-entwickler von sich gibt, der IPC konnte von Tick auf Tick um 8 bis 10% gesteigert werden (nur ein Beispiel).
wie kommst du auf das? ich kann mich an keine einzige folie mit IPC-gains erinnern nach der es keine diskussion darüber gab die realistisch das sei.

Badesalz
2020-06-28, 21:19:36
weil sich die relationen ändern. höher getaktete cores haben z.B. weniger speicherbandbreite und höhere speicherlatenz pro clock cycle.Also wäre der 4.6Ghz Sandy da quasi noch zusätzlich im Nachteil? :| Macht es das besser oder schlimmer?

kann man nicht verallgemeinern. zen 2 ist beim packen ungewöhnlich stark, die sprünge sandy -> haswell -> skylake hingegen sind z.B. in spielen (sofern wirklich ein CPU-limit herrscht und genug threads da sind) eher größer als beim packen, besonders bei den unteren quantilen.Ähmm. Da sind jetzt außer dem Sandy ein 6600K und ein 3950X dabei...

wie kommst du auf das? ich kann mich an keine einzige folie mit IPC-gains erinnern nach der es keine diskussion darüber gab die realistisch das sei.Ist mir nie aufgefallen. Meist gehört das für mich nur zu den Aufgeilitis-Aspekten. Oder jemand macht dann Aida an :usweet: