PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : MR² CPU-Mark 2.0 Beta 64-Bit


Nakai
2015-10-08, 01:50:57
Der neue MR² CPU-Mark ist ab sofort in Version 2.0 Beta verfügbar. Alle Benchmarks wurden überarbeitet. Die Ergebnisse sind selbstverständlich nicht vergleichbar mit Vorgängerversionen. Ebenfalls gibt es nur noch eine 64Bit-Version.


Features:

CPU - Speedtest
Testet die arithmetische und numerische Performance, sowie den Durchsatz transzedenter Operationen. Numerische Abweichungen werden nicht beachtet.

Cache - Speedtest
Matrizenmultiplikation ist eine cache-Intensive Anwendung und findet hierbei Anwendung.

PI - Speedtest
Die Zahl PI wird anhand der Bailey-Borwein-Plouffe-Formel (https://de.wikipedia.org/wiki/Bailey-Borwein-Plouffe-Formel) berechnet und ist damit parallel auf einer GPU ausführbar.

MEM -Speedtest
Testet die Load und Store-Performance der zugrundeliegenden Architektur.

alle Tests jeweils Single-, Multithreaded und OpenCL
fixe Zeitdauer für Berechnungen


Voraussetzungen:

mindestens Windows XP 64Bit
mindestens .NET 4.0 Framework
x64-Prozessor


Anmerkung:
Getestet mit AMD GCN, Nvidia Kepler+ und Intel Onboard HD5000+
Ältere GPU-Architekturen nicht getestet


Download:
MR² CPU-Mark 2.0 Beta 64-Bit (http://heiko.amberlin.eu/Download/MrH%20CPU%20Mark%202.0%20Beta%2064-Bit.rar)



Beta Disclaimer:
Hierbei handelt es sich um eine Beta-Version der Software. Der Zweck dieses Software Releases ist es die Qualität und Zuverlässig mit User Feedback zu optimieren, bis ein finales Release entsteht. Die Entwickler übernehmen keinerlei Verantwortung und sind froh über gemeldete Instabilitäten und Performance-Probleme.;)

Neosix
2015-10-08, 02:15:47
Dann fange ich mal als erster an

http://abload.de/img/bench1wjm0.png

K-putt
2015-10-08, 07:33:57
https://www.forum-3dcenter.org/vbulletin/attachment.php?attachmentid=53501&stc=1&d=1444292539

Leonidas
2015-10-08, 08:22:39
Mit Core i5-4210U & HD Graphics 4400:

http://www.forum-3dcenter.org/vbulletin/attachment.php?attachmentid=53500&d=1444285340

Hobby
2015-10-08, 10:11:37
AMD 8350 def. 8 x 4000 Mhz / Vcore 1.3 Volt def.
MSI GTX 960 / 2 GB

Achill
2015-10-08, 10:29:57
@Nakai, schönes Update ... :)
- Das ist die erste Version, die auf meiner Plattform nicht den Treiber bei OpenCL resettet - etwas geändert?
- Nutzt ihr eigentlich OpenCL 1.2 oder 2.0+ - gibt es Unterschiede, wenn ja könnte man dies in den Bench als zusätzlichen Lauf integrieren?
- Wäre ein Vergleich mit Compute Shader von DirectX sinnvoll?

Win10, 5280k@4Ghz (24/7), DDR4@2400, 290X-TriX@Default

http://www.forum-3dcenter.org/vbulletin/attachment.php?attachmentid=53507&stc=1&d=1444292593

Nakai
2015-10-08, 12:17:23
@Nakai, schönes Update ... :)
- Das ist die erste Version, die auf meiner Plattform nicht den Treiber bei OpenCL resettet - etwas geändert?
- Nutzt ihr eigentlich OpenCL 1.2 oder 2.0+ - gibt es Unterschiede, wenn ja könnte man dies in den Bench als zusätzlichen Lauf integrieren?
- Wäre ein Vergleich mit Compute Shader von DirectX sinnvoll?


Es wurden alle OpenCL-Kernels neugeschrieben. NV unterstützt kein OpenCL 2.0+, ergo ist dies nicht drin. Von den Funktionalitäten ist es eher simples OpenCL 1.0, Support aber maximal bis 1.2.

Der Vergleich mit Compute Shader ist etwas daneben.
https://msdn.microsoft.com/de-de/library/windows/desktop/ff476331(v=vs.85).aspx

Ich bin mir nicht sicher, inwieweit das für DX11+ gilt, aber OpenCL hat deutlich weniger Einschränkungen und ist am ehesten mit CUDA vergleichbar.
Aber ich habe weniger Ahnung mit Compute Shader und Grafikprogrammierung im Allgemeinen.

Im Grunde ist es dasselbe, nur eben anders. Ergo anderer Compiler, andere Programmiersprache, etwas anderer Zugriff auf die Hardware, etc.

Vergleich möglich und sinnvoll, aber hierbei nicht erwünscht.:D

Radeonfreak
2015-10-08, 13:26:08
3570K 4.4GHZ DDR 3 1866

http://abload.de/img/test9ku5q.png

tb
2015-10-08, 14:05:14
2x Xeon E5-2687W V2 @ 3.4Ghz, 64GB DDR3-1600 ECC, Asus Radeon R9 Fury

http://abload.de/img/benchbeke1.png

Hakim
2015-10-08, 16:46:07
CPU ist normal @4ghz, weiß nicht warum da der normale stock wert steht.

samspade
2015-10-08, 17:03:32
die GPU ist eine HD7950 @900 MHz. Warum er die Intel anzeigt, k.A.

Loeschzwerg
2015-10-08, 17:54:32
VIA QuadCore E C4650 @ 2.0GHz und R9 Nano

53515

BlackArchon
2015-10-08, 19:58:05
Und auch hier Kabini-Power: AMD A4-5000 (4x 1,5 GHz, 15 Watt, DDR3-1600) und Catalyst 15.7.1:

Single 38, Multi 135, OpenCL: 154

Angel3DWin
2015-10-08, 20:40:10
Mhm....

GaryX
2015-10-08, 22:45:46
AMD fx-8370
32gb corsair ddr3 9-11-11-31 / 2133
Geforce gtx 570

http://abload.de/img/mr0006wfsu8.jpg

Darkman.X
2015-10-09, 00:44:28
Bugs (Win7 und Win10 getestet):

Die Thread-Anzahl (12) wird nicht angezeigt. Bei einigen anderen Usern fehlt sie auch, vermutlich gibt es Probleme bei der Darstellung einer 2-stelligen Thread-Anzahl.
Die Backspacetaste funktioniert im Speed-Textfeld nicht. Im GPU-Info-Textfeld funktioniert sie ohne Probleme.
Bei "GPU Info" werden nur 4 von 6 GB angezeigt.


Benchmark:
Intel Core i7-5930K @ 4 GHz
MSI GTX 980 Ti Gaming 6G @ 1178 MHz Core-Takt / 1279 MHz Boost-Takt / 7100 MHz Speichertakt

http://www.forum-3dcenter.org/vbulletin/attachment.php?attachmentid=53523&d=1444344167

-=Popeye=-
2015-10-09, 01:35:23
5820k @ 4,0GHz // TitanX @ 1415/4001

http://abload.de/img/mr2cpuhbp2l.png

BlacKi
2015-10-09, 02:11:27
5820k@4,4 tdp max 130w

-=Popeye=-
2015-10-09, 02:40:57
Lol:confused:

Achill, Darkman.X, BlacKi und ich haben quasi die selbe CPU mit ähnlichen Werten bis auf den Cache. WTF?

edit: ich habe...

Strap 100
Uncore 3000

... laufen.

Darkman.X
2015-10-09, 03:09:48
Ich habe auch Strap 100 und Uncore (=Cache-Takt?) 3000. Ich habe die CPU nur über den Multiplikator übertaktet, der Rest steht auf Auto / Standard-Werte.

Seth
2015-10-09, 04:02:47
i7-4770k 4,4GHz (4,2GHz Cache) / 8GB DDR3-2400MHz / R9 390X 1100/1650MHz / Windows 10 / Catalyst 15.7.1

Single:227 Multi:889 OpenCL:5333

http://www.forum-3dcenter.org/vbulletin/attachment.php?attachmentid=53527&stc=1&d=1444356292

BlacKi
2015-10-09, 11:34:29
Lol:confused:

Achill, Darkman.X, BlacKi und ich haben quasi die selbe CPU mit ähnlichen Werten bis auf den Cache. WTF?

edit: ich habe...

Strap 100
Uncore 3000

... laufen.

Strap 100
Uncore 3300

Achill
2015-10-09, 14:48:16
Lol:confused:

Achill, Darkman.X, BlacKi und ich haben quasi die selbe CPU mit ähnlichen Werten bis auf den Cache. WTF?

edit: ich habe...

Strap 100
Uncore 3000

... laufen.


Bei mir sind es:
Strap 100
Uncore 3300

Der Unterschied ist, dass wir alle Win10 im Einsatz haben und Popeye Win8.1 ... es kann damit die .Net Runtime anders sein (Win10 hat ja schon 4.6) und ggf. anderer Microcode via Bios / Windows geladen werden.

kruemelmonster
2015-10-09, 15:25:36
i7 2600k @ 4.4 GHz / 16 GB DDR3 1866 CL9__________ Xeon X3470 (i7 870) @ 3.66 GHz / 10 GB 1333 CL9____ ~ taktnormierter Vergleich Lynnfield <-> Sandy Bridge
http://www.forum-3dcenter.org/vbulletin/attachment.php?attachmentid=53530&stc=1&d=1444396865 http://www.forum-3dcenter.org/vbulletin/attachment.php?attachmentid=53531&stc=1&d=1444396865 http://www.forum-3dcenter.org/vbulletin/attachment.php?attachmentid=53534&stc=1&d=1444397490

BlackArchon
2015-10-09, 16:13:40
Hier ein i5-3470 (Ivy Bridge) mit einer unglaublich schnellen Radeon HD 7470, alles auf Standardtakt. Läuft also auch auf Prä-GCN-Karten.

BlackArchon
2015-10-09, 16:23:25
Und hier mein i5 4690K (alle Turbomultis auf 39) mit einer GeForce GTX 970. Interessant, dass Pi-Berechnungen auf der Graka kaum schneller als auf der CPU sind.

Godmode
2015-10-09, 16:47:33
5960X @ 4,375 GHz HT Off
16 GB DDR4 2666 MHz
Titan X @ 1,45|4,00 GHz
Win 8.1 x64 Geforce 355.98

Nuon
2015-10-09, 20:55:08
I5 6600K@4.2GHz rest auf default
GTX760 @default

BlackArchon
2015-10-09, 21:43:56
I5 6600K@4.2GHz rest auf default
GTX760 @default
Aha, mein i5-4690K@3,9 GHz hat also 53% mehr Leistung beim Singlecore-Cache wert als dein i5-6600K@4,2 GHz. Sehr interessant. :freak:

@Nakai, was misst der Benchmark dort überhaupt?

Radeonfreak
2015-10-09, 22:31:50
Ich bin auch schneller. Das freut mich. :freak:

Achill
2015-10-09, 22:36:16
Aha, mein i5-4690K@3,9 GHz hat also 53% mehr Leistung beim Singlecore-Cache wert als dein i5-6600K@4,2 GHz. Sehr interessant. :freak:

@Nakai, was misst der Benchmark dort überhaupt?

Wie schon der Unterschied bei den i7 mit 6 & 8 Kernen liegt es mit hoher Wahrscheinlichkeit an der OS-/.net-Version. Win7 & 8 hat anscheinend rund 2x besseren Werte bei den Cache-Punkten.

Tyrann
2015-10-09, 22:38:27
und ich bin noch schneller als Freaky

http://s1.bild.me/bilder/030315/1126078MrH.png (http://www.bild.me)

kruemelmonster
2015-10-09, 22:56:28
Wie schon der Unterschied bei den i7 mit 6 & 8 Kernen liegt es mit hoher Wahrscheinlichkeit an der OS-/.net-Version. Win7 & 8 hat anscheinend rund 2x besseren Werte bei den Cache-Punkten.

Lynnfield kommt auf gleichem Takt (und gleichem OS) auch schneller als Sandy Bridge beim CPU-Wert raus, das sollte ebenso wenig passieren wie dass GF100 im PI Bench alle anderen NV Chips vermöbelt.

BlackArchon
2015-10-09, 23:39:19
Hm, scheint ja noch ganz schön Beta zu sein, der Benchmark.

@Nakai:
Sag Bescheid, wenn wir dir irgendwie helfen können.

Nakai
2015-10-10, 00:14:12
Danke für das Angebot. Und es wird sehr wahrscheinlich genutzt werden, aber das muss erstmal alles geplant werden. :)

Ich geh jetzt erstmal auf ein paar Punkte ein:

Unstimmigkeiten im Single bezügliche Cache:
Der Cache Benchmark führt eine simple Matrizenmultiplikation durch. Matrizenmultiplikation ist ein Paradebeispiel für Caching-Effekte, da Daten wiederverwendet werden. Die Matrizen sind 100+x100+ groß, sollten also ohne Probleme in den Caches derzeitiger CPUs passen. Womöglich müssen die Daten im Speicher anders angeordnet werden, damit bessere Caching-Effekte eintreten. Wieso bestimmte "ältere" CPUs soviel schneller sind...das ist ein interessanter Aspekt. Matrizenmultiplikation verwendet keinerlei Branching und ist völlig In-Order. Kurz, reinher von der Ausführungs gibt es keine Überraschungen. Es kommt eher auf die Organisation der Daten o.Ä an. Hier wird auf jedenfall nachgeforscht.

Unstimmigkeiten im GPGPU bzgl PI:
Die Bailey-Borwein-Plouffe-Formel lässt sich gut parallelisieren. Die Summe muss auf der Grafikkarte mit einer Reduktion(Copy => Local Memory; dann Summierung mit MAskierung) durchgeführt werden. Wieso GCN & Fermi gegen Kepler & Maxwell so auftrumpfen, könnte mit der Reduktion zu tun haben. Ich hatte diesbezüglich schon öfter Performanceunterschiede von Fermi => Kepler bei Block-Synchronizationen.
Mich hat es nicht sonderlich verwundert, dass Fermi hier besser ist als erwartet. Ich hatte es selber schon vorher erlebt.

Andere Unstimmigkeiten:
Die Skalierung von GCN1.0,1.1 auf 1.2(Tonga und Fiji) ist auch fragwürdig. Ich würde einige Treibersachen auch nicht ausschließen.

Ich melde mich, wenn ich Einiges mehr organisiert ist. Ich muss erstmal genau wissen, was getestet und überprüft werden muss. Ich besitze nur GCN, was gut ist für OpenCL-Developement. Bei NV wird es schwieriger. Hier muss dann eher mit GPUView versucht werden, was die Probleme sind. Ich versuche das die nächsten Tage zu organisieren, und eine Tester-Version zu generieren, damit das alles deutlich besser abläuft.

Ich melde mich diesbezüglich nochmal.

€: Vergleicht bitte OpenCL und CPU-Ausführung nicht. Die Werte sind nicht vergleichbar. Die Aufgaben sind ähnlich, aber die Daten haben andere Größen. GPU ist immer schneller.

Achill
2015-10-10, 10:56:19
@Nakai, @kruemelmonster - ich habe nochmal alle CPU-Ergebnisse von Intel-CPUs überflogen. Es sind immer dann die Cache-Werte höher, wenn es Windows 7 oder 8.1 ist.

Angel3DWin
2015-10-10, 13:20:46
Mich würde mal Skylake 6700k in Verbindung mit der Titan X interessieren. Meine CPU ist ja nun doch etwas angestaubt :D

tdon
2015-10-10, 21:05:21
Skylake ist aber langsamer als die Vorgänger CPUs in dem Benchmark, insbesondere die Single Werte. Cache Single+Multi auf Windows 7 deutlich schneller, Memory Single ebenfalls von meinem 6700k. Dagegen ist CPU Multi auf Windows 10 schneller.


http://fs5.directupload.net/images/151010/32zkvbs8.pnghttp://fs5.directupload.net/images/151010/yhg5xb4k.png

Mit DDR4-3000 CL15. Ein extra Feld für Speichergeschwindigkeit wäre nicht schlecht.

BlackArchon
2015-10-10, 23:49:07
Hm, böse Falle: auf den ersten Blick glaubt man zu sehen, dass die Intel HD 530 genau gleich schnell wie die GTX 970 ist. Erst der genauere Blick auf das OpenCL-Device verrät, dass beide Male die GTX 970 gebencht wurde.

IchoTolot
2015-10-11, 00:35:16
https://lh3.googleusercontent.com/-xkxQS1_0SfA/VhmSXYLVUQI/AAAAAAACAOA/twi6mMvsJts/w367-h616-no/Mr%25C2%25B2%2BCPU-Mark.png

Darkman.X
2015-10-11, 03:58:04
@Nakai, @kruemelmonster - ich habe nochmal alle CPU-Ergebnisse von Intel-CPUs überflogen. Es sind immer dann die Cache-Werte höher, wenn es Windows 7 oder 8.1 ist.

Win7 scheint bei mir keinen Cache-Vorteil zu haben. Die Werte sind mit Win10 identisch. Bei beiden habe ich NET 4.6 installiert, falls es wichtig ist.

Win7|Win10
http://www.forum-3dcenter.org/vbulletin/attachment.php?attachmentid=53563&stc=1&d=1444527915|http://www.forum-3dcenter.org/vbulletin/attachment.php?attachmentid=53564&stc=1&d=1444527915

(Die OpenCL-Werte bitte ignorieren. Ich habe in Win7 das OC-Tool für die GraKa nicht installiert.)

TB1333
2015-10-23, 15:45:58
http://abload.de/img/mr2benchmark2.04vp8s.png

Achill
2015-10-25, 09:13:28
Win7 scheint bei mir keinen Cache-Vorteil zu haben. Die Werte sind mit Win10 identisch. Bei beiden habe ich NET 4.6 installiert, falls es wichtig ist.

Win7|Win10
http://www.forum-3dcenter.org/vbulletin/attachment.php?attachmentid=53563&stc=1&d=1444527915|http://www.forum-3dcenter.org/vbulletin/attachment.php?attachmentid=53564&stc=1&d=1444527915

(Die OpenCL-Werte bitte ignorieren. Ich habe in Win7 das OC-Tool für die GraKa nicht installiert.)

Thx, dann wird es mit hoher Wahrscheinlichkeit an der Version der .Net-Runtime liegen ... .net v4.6 ist ja nicht Standard unter Win7.

@Nakai, könntet ihr in der UI die .Net-Version mit anzeigen, mit der gerade der Benchmark ausgeführt wird?

Nakai
2015-11-03, 21:45:20
So...

...eine neue Version steht demnächst an, mit vielen Bugfixes und überarbeiteten Benchmarks. Dementsprechend bräuchten wir einen Tester für MultiGPU-Support. Interessant wären auch Besitzer mit MixedGPU-Systemen, ergo AMD, Intel und NVidia gemischt.

@Nakai, könntet ihr in der UI die .Net-Version mit anzeigen, mit der gerade der Benchmark ausgeführt wird?

Danke für den Hinweis. Das wird berücksichtigt.

Achill
2015-11-03, 22:33:39
@Nakai, ich kann mit 2x290X Beta-Tester spielen. Kann aber nicht den Fall mit einer iGPU + dGPU abdecken.

Nakai
2015-11-03, 23:05:43
PN.:)

Nakai
2015-11-04, 18:05:26
Die ersten Tests mit MultiGPU sind gefahren. Wir brauchen trotzdem noch mehr Tester, auch mit gemischten GPU-Systemen (Onboard + Dediziert, Dediziert + Dediziert). Die Tests dauern nicht lange und dienen zur Fehlersuche.

Also Freiwillige vor.^^;)

tdon
2015-11-04, 19:21:08
Onboard + Dediziert könnte ich testen.