PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Wo finde ich Ueberblick zur Pro MHz Leistung von CPUs?


elianda
2005-09-30, 20:22:03
Hallo,

ich suche fuer einen Vortrag einen Ueberblick zur pro MHz Leistung von CPUs, hauptsaechlich x86 CPUs.
Insbesondere interessant ist
80486 -> Pentium (CISC -> RISC Kern)
und architekturell bedingte Werte.
zB Athlon , P2/3 (Deschutes / Katmai) und jeweils mit integriertem L2-Cache (TBird / Coppermine).

Weitere Werte zB 5kx85 und die K6 Serie wuerde dazwischen gut reinpassen.

Ich weiss, dass 'Leistung' ne Definitionssache des Benchmarks ist. Deshalb sollte das auch etwas genauer dastehen, wie das gemessen wurde.

Kennt da jemand eine Quelle fuer? Diesbezueglich scheints irgendwie kaum Informationen zu geben.

Ciao...
...Micha

alpha-centauri
2005-09-30, 21:32:34
tomshardware hat vor ner zeit über 100 cpus gebencht. das könntest di rja ausrechnen.

BlackBirdSR
2005-10-01, 00:34:11
Hallo,

ich suche fuer einen Vortrag einen Ueberblick zur pro MHz Leistung von CPUs, hauptsaechlich x86 CPUs.


Sowaws gibts z.B für Seti oder RC64,
das sind aber immer spezialfälle, die selten mit dem normalen Einsatz konform gehen.

GloomY
2005-10-01, 00:58:50
tomshardware hat vor ner zeit über 100 cpus gebencht. das könntest di rja ausrechnen.Deren Benchmarks halte ich aber für nicht sehr gut. Insbesondere schneiden die SSE-losen Athlons / Durons / K6 etc. bei Winrar viel zu schlecht ab. Da ist ein Celeron 500 MHz so schnell wie ein Thunderbird mit 1 GHz. :eek:
Aber als Anhaltspunkt ist das sicher mal interessant. Man darf dem ganzen bloß keinen absoluten Glauben schenken.

Von so ganz alten Rechnern wie 486 und Pentium kenne ich jetzt persönlich keine Werte. So weit ich es aber in Erinnerung habe, hatte der Pentium aber einen höheren IPC Wert wenn der Code gut gescheduled war (man erinnere sich an die 'U' und 'V'-Pipelines) - sprich: Er erreichte schon mit weniger MHz die Leistung des 486ers. Kein Wunder bei einem superskalarem Prozessor. ;)

kelo
2005-10-04, 01:17:26
Historische Benchmarks:
http://homepage.virgin.net/roy.longbottom/index.htm

PC-Leistungsvergleich:
http://homepage.virgin.net/roy.longbottom/cpuspeed.htm

Whetstone durch Architekturen (auch non-x86) hinweg:
http://homepage.virgin.net/roy.longbottom/whetstone.htm
PCs (Precision P14) via the same optimised Watcom compiled C/C++ code
Note: results are proportional to MHz for a particular type of CPU
CPU Clock VAX MWIPS Intr
MHz MWIPS MFLOPS MIPS DP Date

AM386/387 40 5.68 0.820 7.40 5.20 1991
80486DX2 66 15.3 3.48 29.0 15.5 1992
AMD5X86 100 25.0 5.73 44.4 1995
Winchip C6 200 40.6 11.8 103 1997
Pentium 75 48.2 12.2 71.2 49.5 1994
Cyr P150 120 53.5 10.7 96.1 53.7 1996
IBMC6x86 150 66.1 13.2 118 66.2 1996
Pentium 100 66.2 16.8 97.8 66.2 1994
Pentium 120 79.5 20.2 118 81.6 1995
CyrPR233M 188 88.0 18.2 159 88.7 1997
Pentium 133 88.3 22.4 130 90.8 1995
CyrMII300 233 109 22.6 198 113 1998
Pent MMX 166 112 28.1 174 115 1997
Pentium 200 132 33.7 196 136 1996
Pent MMX 200 134 33.7 209 137 1997
AMD K6 200 124 28.6 197 121 1997
PentiumPro 200 161 41.5 315 167 1995
AMD K6 266 167 39.7 260 162 1998
PentiumPro 233 189 48.3 368 195 1997
AMD K6 300 191 45.3 297 184 1998
Pentium II 233 191 48.3 371 198 1997
Pentium II 266 218 55.3 422 226 1997
Celeron A 300 245 62.5 476 252 1998
Pentium II 300 245 62.1 474 254 1998
AMD K63 450 286 67.9 444 275 1999
Pentium II 350 286 72.7 555 297 1998
AMD K62 500 309 73.3 481 297 1999
Pentium III 450 367 93.5 714 379 1999
Pentium II 450 368 93.3 714 382 1998
Athlon 500 381 81.7 789 382 1999
Celeron 466 382 96.6 740 396 1999
Pentium III 550 448 114 870 463 1999
Duron 600 463 99.4 957 464 2000
Duron 700 541 116 1119 541 2000
Athlon 700 544 117 1130 545 1999
Pentium III 700 572 145 1102 593 1999
Celeron 733 598 151 1155 622 2001
Pentium 4 1700 603 152 798 621 2001
Pentium 4 1800 639 161 845 639 2001
Pentium 4 1900 671 168 868 670 2001
Pentium 4 2052 726 183 959 725 2002
Athlon TBD 1000 769 165 1590 770 2000
Duron 1000 772 165 1598 2002
P4 Xeon 2200 773 195 996 805 2002
Pent III 1000 816 207 1580 843 2002
P3 Tualatin 1200 972 248 1880 1006 2002
Pentium 4E 3000 1028 233 1882 1057 2004
Pentium 4 3066 1119 274 1516 1156 2003
Athlon 4 1533 1193 253 2458 1194 2002
Pentium 4 3382 1233 302 1668 1282 2003
Pentium 4 3678 1342 327 1823 1394 2003
Athlon 4 1789 1389 295 2862 1391 2002
Athlon4B 1800 1397 297 2673 1448 2003
Athlon 4 1865 1450 308 2991 1451 2002
Opteron 1991 1580 332 3369 1572 2003
Athlon 64 2150 1720 361 3651 1701 2003
Athlon 4 2338 1805 385 3453 1890 2004
Compilervergleiche:
PU Clock Basic Basic Basic Fort Fort C Nop HTML C Opt C Opt
MHz Int Com VB4 Pro MS5 Wat Java Wat MS6

8088/87 4.8 0.0015 0.0104
80286/287 6 0.0040 0.0320 0.0852
AM386/387 40 0.0640 0.514 1.03 1.81 2.52 3.07 5.68
80486DX2 66 0.125 1.39 3.42 5.91 7.43 10.0 10.4 15.3 12.0
Pentium 100 0.349 3.81 7.92 15.7 21.0 30.1 38.7 66.2 60.4
Pentium MMX 200 0.710 7.90 13.6 30.0 44.2 52.3 80.6 134 123
Pentium Pro 200 0.810 4.83 16.7 19.0 27.3 81.7 109 161 158
Celeron 450 1.29 11.1 37.9 44.7 75.2 182 269 367 342
Duron 1000 2.48 32.3 80.6 73.3 130 487 542 772
Pentium 4 1900 4.01 21.3 102 29.3 92.2 246 487 671 727
Pentium 4E 3000 5.54 131 473 1028
Athlon 4 2088 9.90 62.5 167 154 279 1083 1069 1620 1788

Computer von 1960 bis 1971 in kips (kilo ips) ;)
http://homepage.virgin.net/roy.longbottom/cpumix.htm

Mips durch Architekturen hinweg:
http://homepage.virgin.net/roy.longbottom/mips.htm
(Nach Intel, AMD usw. schauen)

/Edit
64-bit Windows:
http://homepage.virgin.net/roy.longbottom/win64.htm

Dualcore:
http://homepage.virgin.net/roy.longbottom/dualcore.htm

diedl
2005-10-04, 04:37:10
Vielleicht auch noch ganz interessant.
Wenn es um die reine Prozessorleistung praktisch ohne Berücksichtigung
der Speicheranbindung geht.

ZVEBench von BubbleBoy

http://www.forum-3dcenter.org/vbulletin/showthread.php?t=128233

mfg diedl

alpha-centauri
2005-10-04, 11:23:46
[QUOTE=GloomY]Deren Benchmarks halte ich aber für nicht sehr gut.

also ich frag mich echt, wieviel hundert benchmarks die dann noch nur für dich durchführen sollen.

IIRC 20 benches pro cpu sollten doch wirklich genügen.

Insbesondere schneiden die SSE-losen Athlons / Durons / K6 etc. bei Winrar viel zu schlecht ab. Da ist ein Celeron 500 MHz so schnell wie ein Thunderbird mit 1 GHz. :eek:

so und? bewertest du die cpu nur nach einem benchmark?

Von so ganz alten Rechnern wie 486 und Pentium kenne ich jetzt persönlich keine Werte. So weit ich es aber in Erinnerung habe, hatte der Pentium aber

nimmste die spielebenches .

soweit ich mich noch erinnere, waren die ersten pentium 1 (IIRC 60 / 75 mhz ??) langsamer, als die dx4 66 mhz x68er

BlackBirdSR
2005-10-04, 11:34:13
[QUOTE]

soweit ich mich noch erinnere, waren die ersten pentium 1 (IIRC 60 / 75 mhz ??) langsamer, als die dx4 66 mhz x68er

Und wieviel Schuld daran hatte der Chipsatz, PCI und auf 386 angepasster Code?
Heute würde das anders aussehen. Aber dem Pentium4 gings ja ähnlich.

elianda
2005-10-04, 11:37:36
Danke fuer die Links, das gibt echt ne groessere Datenbasis als ich mir erhofft hatte.
Ich habe bei auch bei www.cpu-world.com auch noch einige Benchmarks zu CPUs gefunden.

GloomY
2005-10-04, 16:09:04
also ich frag mich echt, wieviel hundert benchmarks die dann noch nur für dich durchführen sollen.
IIRC 20 benches pro cpu sollten doch wirklich genügen. Es geht hier ja nicht um die Anzahl. Ich gebe mich schon mit 5 Benches zufrieden, wenn diese gescheid sind.

Natürlich sind mehr Benches immer gut, besonders wenn man weiss, was der Bench macht (Source Code verfügbar oder sonstige Analysemöglichkeiten). Der SPEC CPU 2000 Bench hat auch eine Menge an Tests und das schöne daran ist, dass diese unterschiedliche Anforderungen haben (teils I/O-lastig, teil stark latenz-kritisch oder bandbreiten-hungrig, teils sehr viele Sprünge etc.).
so und? bewertest du die cpu nur nach einem benchmark?Nein, tue ich nicht. Es ist aber auffällig, dass die WinRAR Ergebnisse von THG zu anderen Schlüssen führen als andere Messungen bei dritten.

Ich meine sogar den Grund dafür zu kennen: Die SSE-fähigen Intel Prozessoren legen überdurchschnittlich stark zu - mehr als der reine prozentuale Taktunterschied zwischen den SSE-losen Intel-Prozessoren erlauben dürfte (vergleiche z.B. Mendocino vs. PIII-Celeron). Das bedeutet, dass hier WinRAR massiv SSE(1) benutzt - zumindest bei der WinRAR-Version, welche bei THG benutzt wird.

Dagegen ist ja erstmal nichts einzuwenden, jedoch stellt man diesen starken Zuwachs eben nur bei den Intel Prozessoren fest. Ein SSE-loser Spitfire Duron ist bei ähnlicher Taktung gleich schnell wie ein SSE-fähiger Morgan Duron. Und das passt nicht zusammen.
Ich weiss ja, dass es durchaus Unterschiede in der Mikroarchitektur von Intel und AMD geben kann und dass es durchaus mal sein kann, dass eine Codefolge eher der einen oder der anderen Prozessorarchitektur passt. Aber ein solcher eindeutiger Zuwachs durch SSE auf der einen Seite bei Intel Prozessoren und ein nicht vorhandener Zuwachs durch SSE bei Nicht-Intel Prozessoren deutet für mich relativ klar darauf hin, dass nur bei Intel SSE benutzt wird und sonst eben nicht.

Ein Unterschied von nahezu 100% (Celeron 533 ist so schnell wie ein T-Bird mit 1 GHz) ist nichts, was man mit Unterschieden in der Mikroarchitektur erklären könnte. Das wäre vielleicht 10 oder 20%. Hier wird einfach einmal SSE benutzt und das andere Mal nicht.

Und deswegen sage ich eben, dass ich den Ergebnissen nicht traue, u.a. weil andere Seite dem K7/K8 eher eine sehr gute WinRAR Performance bescheinigen.
Und wieviel Schuld daran hatte der Chipsatz, PCI und auf 386 angepasster Code?
Heute würde das anders aussehen. Aber dem Pentium4 gings ja ähnlich.Gerade der Pentium1 ist stark auf für ihn geschedulten Code angewiesen. Als Prozessor mit In-Order Ausführung kann er seine beiden Integer-Einheiten nur dann nutzen, wenn die Befehle im Code für ihn so angeordnet sind, dass er sie gleichmäßig verteilen kann.

Dazu kommt noch, dass die beiden Pipelines nicht exakt das gleiche können. Die "u"-Pipeline kann alles, während die "v"-Pipeline nur bestimmte Befehle kann, und das auch nur in bestimmten Kombinationen mit der "u"-Pipeline.
Sowas gab es natürlich beim 486 und davor gar nicht, ergo war der Code dort sicher nicht optimal.

kelo
2005-10-04, 19:39:38
Es geht hier ja nicht um die Anzahl. Ich gebe mich schon mit 5 Benches zufrieden, wenn diese gescheid sind.
Welche 5? ;)
Natürlich sind mehr Benches immer gut, besonders wenn man weiss, was der Bench macht (Source Code verfügbar oder sonstige Analysemöglichkeiten). Der SPEC CPU 2000 Bench hat auch eine Menge an Tests und das schöne daran ist, dass diese unterschiedliche Anforderungen haben (teils I/O-lastig, teil stark latenz-kritisch oder bandbreiten-hungrig, teils sehr viele Sprünge etc.).
Nein, tue ich nicht. Es ist aber auffällig, dass die WinRAR Ergebnisse von THG zu anderen Schlüssen führen als andere Messungen bei dritten.

Ich meine sogar den Grund dafür zu kennen: Die SSE-fähigen Intel Prozessoren legen überdurchschnittlich stark zu - mehr als der reine prozentuale Taktunterschied zwischen den SSE-losen Intel-Prozessoren erlauben dürfte (vergleiche z.B. Mendocino vs. PIII-Celeron). Das bedeutet, dass hier WinRAR massiv SSE(1) benutzt - zumindest bei der WinRAR-Version, welche bei THG benutzt wird.

Dagegen ist ja erstmal nichts einzuwenden, jedoch stellt man diesen starken Zuwachs eben nur bei den Intel Prozessoren fest. Ein SSE-loser Spitfire Duron ist bei ähnlicher Taktung gleich schnell wie ein SSE-fähiger Morgan Duron. Und das passt nicht zusammen.
Ich weiss ja, dass es durchaus Unterschiede in der Mikroarchitektur von Intel und AMD geben kann und dass es durchaus mal sein kann, dass eine Codefolge eher der einen oder der anderen Prozessorarchitektur passt. Aber ein solcher eindeutiger Zuwachs durch SSE auf der einen Seite bei Intel Prozessoren und ein nicht vorhandener Zuwachs durch SSE bei Nicht-Intel Prozessoren deutet für mich relativ klar darauf hin, dass nur bei Intel SSE benutzt wird und sonst eben nicht.

Ein Unterschied von nahezu 100% (Celeron 533 ist so schnell wie ein T-Bird mit 1 GHz) ist nichts, was man mit Unterschieden in der Mikroarchitektur erklären könnte. Das wäre vielleicht 10 oder 20%. Hier wird einfach einmal SSE benutzt und das andere Mal nicht.
http://www.tomshardware.de/cpu/20041222/cpu-charts-62.html
Vor allen in den unteren Rängen sind die Werte komisch:
Winrar 3.40 Benches
ab P3 1,2 GHz Tualatin 7:36 runter
Da geht es mit den Takts und den Prozessorfamilien, RAM usw. drunter und drüber. Müsste man überprüfen, ob die Werte stimmen.

Und deswegen sage ich eben, dass ich den Ergebnissen nicht traue, u.a. weil andere Seite dem K7/K8 eher eine sehr gute WinRAR Performance bescheinigen.
Gerade der Pentium1 ist stark auf für ihn geschedulten Code angewiesen. Als Prozessor mit In-Order Ausführung kann er seine beiden Integer-Einheiten nur dann nutzen, wenn die Befehle im Code für ihn so angeordnet sind, dass er sie gleichmäßig verteilen kann.

Dazu kommt noch, dass die beiden Pipelines nicht exakt das gleiche können. Die "u"-Pipeline kann alles, während die "v"-Pipeline nur bestimmte Befehle kann, und das auch nur in bestimmten Kombinationen mit der "u"-Pipeline.
Sowas gab es natürlich beim 486 und davor gar nicht, ergo war der Code dort sicher nicht optimal.
Die Frage ist, wie Winrar optimiert und kompiliert worden ist.