Warum hat AMD noch 3Dnow! drinnen? [Archiv]

thop

2004-02-03, 02:04:20

Wenn ich mich nicht täusche wurde 3DNow! ja zur Zeit des K6 (K6-II?) eingeführt, welcher bekanntlich in Spielen ein wenig langsam war, um das ein wenig zu kompensieren. Ich weiß allerdings nicht ob darauf wirklich irgendjemand jemals optimiert hat, ausser die Quake Engines vielleicht?

Mittlerweile findet man 3DNow! doch nirgends, die einzigen die mir einfallen sind GOGO und ffdshow. Korrigiert mich wenn ich mich täusche aber sonst wird doch nirgendwo auf 3DNow! (und das neuere 3DNow!+) optimiert. Ausserdem kann man sich fragen ob die 3DNow! Optimierung gegenüber SSE/SSE2 Optimierung überhaupt etwas bringt.

Warum schleppt AMD dieses Relikt also noch mit sich? SSE/SSE2 sind eh schon im A64 drinnen, und irgendwann wird auch noch SSE3 den Weg reinfinden. Damit würde man Programmierern das Leben sicherlich ein ganz klein wenig leichter machen, und ein fuzzimeter Platz auf dem DIE könnt man auch sparen.

PS. Vermutlich war das schon längst beschlossene Sache bei AMD aber dann hat planet3dnow.de ein halbes Jahr lang rumgeheult ;D

betasilie

2004-02-03, 02:29:28

Afaik gibt es schon noch einige Anwendungen im Profibereich, die 3Dnow nutzen. Games sind ja nicht alles.

Außerdem ist 3Dnow für wissenschaftliche Großrechner sehr interessant. Solche Rechner werden für Klimforschung etc. eingesetzt und sollen insbesondere wegen 3Dnow sehr mächtig sein.

thop

2004-02-03, 02:31:29

Ok, aber wo liegt der Vorteil von 3DNow! gegenüber SSE? Ist 3DNow! nicht eigentlich das Pendant zu MMX gewesen und 3DNow!+ zu SSE?

Endorphine

2004-02-03, 02:33:17

3DNow ist doch im K8 eh' nur noch in Microcode und nicht mehr festverdrahtet implementiert, oder? Damit benötigt es nur ein bischen Platz im Microcode-ROM, nichts weiter.

Da grösstmögliche Kompatibilität immer erstrebenswert ist soll es AMD von mir aus noch 100 Jahre drin lassen...

mirp

2004-02-03, 07:21:30

Original geschrieben von thop
Ok, aber wo liegt der Vorteil von 3DNow! gegenüber SSE? Ist 3DNow! nicht eigentlich das Pendant zu MMX gewesen und 3DNow!+ zu SSE? Chronologisch vielleicht. Aber MMX war nicht für Floatingpointoperationen geeignet, 3DNow! schon. Das war bei Intel erst durch SSE möglich. Vielleicht hat sich das nicht durchgesetzt, weil die K6 zu wenig verbreitet waren. Außerdem war die FPU der K6 der große Schwachpunkt. Das hat sich dann ja mit dem K7 geändert.

Schroeder

2004-02-03, 07:39:23

Beispielsweise das wunderbare DVDx nutzt noch 3DNow. Um halt generell DVDs in andere "platzsparende" Filmmedien umzurechnen kann man da je nach vorhandenem CPU 3DNow/FPU/SSE/SSE2/MMX als Berechnungseinheiten nutzen. Fragt mich bitte nicht wie das genau funktioniert oder was schneller ist, ich hab meinem P4 einfach immer SSE2 nehmen lassen und fertig.

Lokadamus

2004-02-03, 11:26:56

Original geschrieben von Schroeder
Um halt generell DVDs in andere "platzsparende" Filmmedien umzurechnen kann man da je nach vorhandenem CPU 3DNow/FPU/SSE/SSE2/MMX als Berechnungseinheiten nutzen. Fragt mich bitte nicht wie das genau funktioniert oder was schneller ist, ich hab meinem P4 einfach immer SSE2 nehmen lassen und fertig. mmm...

FPU = Floating Point Unit, der Co-Prozessor, asbach uralt, gibs seit dem 8086, mit Co-Prozessor wurde das Teil dann 8087 genannt ...
MMX = wurde mit dem Pentium 1 eingeführt ...
3Dnow = war die Antwort auf MMX von AMD ...
SSE = Überarbeitete Version des MMX, bekam gleich einen neuen Namen ...
3Dnow+ = ab dem Morgan-Kern (Duron 900) enthalten, laut Toms Hardware ...
SSE 2 = überarbeitete Version, eingeführt mit dem P4 - Willamette ...
SSe 3 = überarbeitete Version, eingeführt mit dem P4 - Prescott ...
Hab hier noch einen Artikel von AcesHardware (http://www.aceshardware.com/Spades/read.php?article_id=20000190) gefunden, ist auf englisch, keine Ahnung, ob der Artikel gut ist ...

Quasar

2004-02-03, 11:55:30

Original geschrieben von mirp
Chronologisch vielleicht. Aber MMX war nicht für Floatingpointoperationen geeignet, 3DNow! schon. Das war bei Intel erst durch SSE möglich. Vielleicht hat sich das nicht durchgesetzt, weil die K6 zu wenig verbreitet waren. Außerdem war die FPU der K6 der große Schwachpunkt. Das hat sich dann ja mit dem K7 geändert.
War da nich noch eine Einschränkung für 3DNow und SSE in Bezug auf Floating-Point? Irgendwas, das man damit nur single-precision rechnen konnte?

BlackBirdSR

2004-02-03, 12:27:27

Original geschrieben von Endorphine
3DNow ist doch im K8 eh' nur noch in Microcode und nicht mehr festverdrahtet implementiert, oder? Damit benötigt es nur ein bischen Platz im Microcode-ROM, nichts weiter.

Da grösstmögliche Kompatibilität immer erstrebenswert ist soll es AMD von mir aus noch 100 Jahre drin lassen...

Die AMD Dokumente geben für alle 3DNow Befehle im K8 den DirectPath weg an.
Also nicht über Microcode.

Edit: SSE und SSE2 sind zum Großteil Doubles

BlackBirdSR

2004-02-03, 12:32:37

Original geschrieben von Quasar
War da nich noch eine Einschränkung für 3DNow und SSE in Bezug auf Floating-Point? Irgendwas, das man damit nur single-precision rechnen konnte?

ja, 3dnow und SSE arbeiten nur mit 32Bit Paketen.
Also 4x32bit.
Das reicht für manch Programme nicht.
Ansonsten läuft 3dnow eben über die x87 Register, und muss sich diese mit MMX und der FPU teilen.

Jetzt bin ich einmal gespannt wie sich SSE2 so macht.
Schließlich ist im 64Bit Modus fast ausschließlich SSE2 am Arbeiten. Die FPU kann in Rente gehen.. dafür hat auch AMDs TFP Konzept dran glauben müssen.

Quasar

2004-02-03, 13:43:52

TFP?

Sandra nach zu urteilen scheint SSE2 beim Athlon64 in etwa 1:1 zum P4 zu performen - dummerweise auch bei 1:1 Takt. :|

Knebel-Lizenz von Intel?

mapel110

2004-02-03, 13:51:58

Original geschrieben von Quasar
Sandra nach zu urteilen

Na?! Wo liegt wohl der Fehler? :)
Kann mir kaum vorstellen, dass Intel in seinen Lizensierungsmodellen sowas vorgibt. Zumindest würde ich dafür andere "Beweise" suchen. ;)

BlackBirdSR

2004-02-03, 13:56:01

Original geschrieben von Quasar
TFP?

Sandra nach zu urteilen scheint SSE2 beim Athlon64 in etwa 1:1 zum P4 zu performen - dummerweise auch bei 1:1 Takt. :|

Knebel-Lizenz von Intel?

Technical Floatingpoint... ein Ersatz für die FPU. Kein Stack, kein x87 Ballast etc.. oh das ist ja fast skalar SSE2.. nehmen wir das doch :)

@K8 SSE2.
Das musst du etwas anders sehen.
Um es vorwegzunehmen, der K8 ist bei SSE2 schon schneller als der P4.. ABER

SSE2 arbeitet als SIMD an 128Bit großen packed Vektoren.
Diese sind 2x64Bit groß. Man kann damit insgesamt 2 Operationen gleichzeitig durchführen.
Also 2Ops.
Da der P4 ebenfalls 2x64Bit große Vektoren bearbeitet, haben wir hier auch 2Ops.
Jetzt spielt nur noch die Implementierung und der Takt eine Rolle. (Sandra würde ich jetzt nicht hernehmen um die generelle SSE2 Leistung zu beweisen, eher als Anhaltspunkt für Fälle wie sie Sandra nutzt)

Der K8 verliert also den direkten Vergleich, weil die Taktrate nicht mitkommt. Wenn man aber mal die Latenzen und sonstiges Drumherum ansieht, arbeitet der K8 bei SSE2 schneller. (FMUL kostet den P4 7Takte, bei SSE2 8. Dem K8 kostet FMUL bei x87 UND SSE2 nur 4 Takte, etc)

Wenn man das ganze auf skalar SSE2 ausweitet (also SSE2 als Ersatz für die x87 FPU, -> kein SIMD), steht der K8 plötzlich um LÄNGEN besser da.
Aufgrund seiner überlegenen FPU erreicht er AUCH hier 2OPs.
Ist also im Skalarmodus im fast Leistungsbereich von SIMD SSE2!
Klar, auch die FPU des K8 kann 2OPs/Takt, aber da ist noch die Sache mit dem Stack und dem x87 Ballast, wodurch hier Performance verloren geht.
Das ist der Grund, warum AMD64 nur SSE2 für Floatingpoint vorsieht.

Der P4 verliert aufgrund seiner FPU bei skalarem SSE2 allerdings wahnsinnig an Leistung. Wenn! Intel AMD kompatibel wird, und AMD64 nutzt. Muss die FPU besser werden, oder man verliert massig an Performance auf den K8.

ace's hat hier was zu packed und skalar performance:
http://www.aceshardware.com/read.jsp?id=55000262
Die Sciencemark benches. (sind natürlich auch nur Indikation, kein Beweis)

GloomY

2004-02-03, 14:18:25

Erst mal was Grundsätzliches: Das Ding heisst "3DNow!" (mit Ausrufezeichen) und wurde mit dem K6-3D (K6 mit 3DNow!) eingeführt, nicht erst mit dem K6-2.
Original geschrieben von BlackBirdSR
ja, 3dnow und SSE arbeiten nur mit 32Bit Paketen.
Also 4x32bit.Imho kann 3DNow! nur zwei 32 Bit SIMD Operationen pro Takt, da es ja auch nur 64 Bit Register hat (diese sind ja physikalisch die FP Register, welche nun mal nur 64 Bit breit sind). Erst SSE hat mit seinen (eigenen) 128 Bit Registern den Weg frei gemacht für vier 32 Bit Operationen pro Takt, obwohl der P3 auch nur zwei pro Takt ausführen konnte.

Wenn wir hier gerade bei SIMD sind, dann möchte ich auch noch eine Anmerkung zu PNI (Prescott new intructions) machen. Manche Leute nennen es SSE3. Das halte ich für Blödsinn, denn es impliziert einen ähnlich großen Sprung in der Performance oder den Features wie von SSE1 zu SSE2. Das ist aber bei weitem nicht der Fall.

Fassen wir mal kurz die bisherigen (x86) SIMD Implementationen zusammen:

MMX: Erstes SIMD überhaupt; nur Integer; 64 Bit; 8, 16 oder 32 Bit Operationen
3DNow!: erstes FP SIMD; 64 Bit; 32 Bit Operationen
SSE1: erstes 128 Bit SIMD; 32 Bit Operationen
SSE2: erstes FP SIMD mit 64 Bit Operationen

Das waren alles Meilensteine in der Entwicklung und jetzt kommt PNI mit seinen 13 Befehlen und will SSE3 heissen? Ich würde das nicht mal SSE 2,1 nennen, besonders weil es ja mit SSE (streaming SIMD Extension) nicht viel zu tun hat. Man muss sich nur mal die neuen Befehle angucken...

BlackBirdSR

2004-02-03, 14:21:53

Original geschrieben von GloomY
Erst mal was Grundsätzliches: Das Ding heisst "3DNow!" (mit Ausrufezeichen) und wurde mit dem K6-3D (K6 mit 3DNow!) eingeführt, nicht erst mit dem K6-2.
Imho kann 3DNow! nur zwei 32 Bit SIMD Operationen pro Takt, da es ja auch nur 64 Bit Register hat (diese sind ja physikalisch die FP Register, welche nun mal nur 64 Bit breit sind).
Erst SSE hat mit seinen (eigenen) 128 Bit Registern den Weg frei gemacht für vier 32 Bit Operationen pro Takt, obwohl der P3 auch nur zwei pro Takt ausführen konnte.

sorry..
3DNow! :)
PS: die x87 sind 80bit breit.. ich weiss, dass du das auch weisst. Nur damits nicht so im Raum steht.

AMD gibt beim K8 einen Durchsatz von 2Mul+2ADD an, also ca 3.4+ FLOPs/Cycle. (vs 1.9Flops/cycle für SSE2)
Dann wird eben an 2 64Bit Registern gearbeitet. Muss ich erst nachschauen.

Ok,
der P3 zerbricht den 4-way 128Bit Vektor in 2x 2-way 64Bit Vektoren, und führt diese dann mit den beiden SIMD Einheiten aus. Natürlich nur für Multiply/ADD Operationen. Aber die sind bei der Angabe der Flops Werte eh zum Standard geworden.

3DNow! machts ähnlich, ausser dass es keine 128Bit Register gibt, und die beiden FPUs beim Athlon direkt als SIMD Einheiten arbeiten.

müsste bei Chip-Architekt oder Arstechnica auch irgendwo stehen. Vielleicht auch bei Ace's

Quasar

2004-02-03, 14:46:20

Original geschrieben von mapel110
Na?! Wo liegt wohl der Fehler? :)
Kann mir kaum vorstellen, dass Intel in seinen Lizensierungsmodellen sowas vorgibt. Zumindest würde ich dafür andere "Beweise" suchen. ;)

Kein Fehler, extra schrieb ich: "Sandra nach z urteilen..." und nicht "SSE2 [tut] beim Athlon64 in etwa 1:1 zum P4 zu performen - dummerweise auch bei 1:1 Takt."

:naughty:

Danke an BB-SR und GloomY für die Guru-Erklärungen :)

Endorphine

2004-02-03, 14:48:23

Original geschrieben von BlackBirdSR
Die AMD Dokumente geben für alle 3DNow Befehle im K8 den DirectPath weg an.
Also nicht über Microcode. Also doch? Was für ne Verschwendung. :D

zeckensack

2004-02-03, 15:23:41

Das Thema hatten wir vor kurzem schonmal (http://www.forum-3dcenter.org/vbulletin/showthread.php?postid=1363015#post1363015) :)

Original geschrieben von Quasar
War da nich noch eine Einschränkung für 3DNow und SSE in Bezug auf Floating-Point? Irgendwas, das man damit nur single-precision rechnen konnte? 3DNow und SSE bearbeiten jeweils nur single precision-Werte (aka "32 Bit"). SSE2 bearbeitet double precision-Werte (aka "64 Bit").

Original geschrieben von GloomY
Erst mal was Grundsätzliches: Das Ding heisst "3DNow!" (mit Ausrufezeichen) und wurde mit dem K6-3D (K6 mit 3DNow!) eingeführt, nicht erst mit dem K6-2."3DNow!" enthält ein Satzzeichen, und das halte ich für unverschämt, da es meinen Schreibfluss unterbricht ;)

"K6-3D" birgt auch eine gewisse Verwechslungsgefahr mit dem K6-3, der natürlich ebenfalls 3DNow beherrscht, aber nicht der erste (AMD-)Prozessor war, der das konnte. Der sogenannte "K6-3D" hingegen ist der K6-2. Letzteres ist auch der offizielle (Verkaufs-)Name.

Original geschrieben von Endorphine
Also doch? Was für ne Verschwendung. :D Finde ich eigentlich nicht :)

Die Ausführungseinheiten können eben wahlweise 2xFP32 oder 1xFP80 (wovon dann bei FP64 einfach etwas weggeschnitten wird). Da das eine native Fähigkeit der Ausführungseinheiten ist, kann es auch den nativen Pfad durch Decode und Dispatch gehen.
Klick (http://www.chip-architect.com/news/2003_09_21_Detailed_Architecture_of_AMDs_64bit_Core.html#2.6)

Coda

2004-02-03, 16:44:55

FPU = Floating Point Unit, der Co-Prozessor, asbach uralt, gibs seit dem 8086, mit Co-Prozessor wurde das Teil dann 8087 genannt ...
MMX = wurde mit dem Pentium 1 eingeführt ...
3Dnow = war die Antwort auf MMX von AMD ...
SSE = Überarbeitete Version des MMX, bekam gleich einen neuen Namen ...
3Dnow+ = ab dem Morgan-Kern (Duron 900) enthalten, laut Toms Hardware ...
SSE 2 = überarbeitete Version, eingeführt mit dem P4 - Willamette ...
SSe 3 = überarbeitete Version, eingeführt mit dem P4 - Prescott ...
MMX gab's erst seit dem Pentium MMX nicht seit dem Pentium
3DNow! kann man kaum als Antwort auf MMX deuten, da es floats und keine interger berechnet
"3DNow Professional" aka 3DNow+ wie du es nennst ist SSE (1)
Und SSE3 SSE3 zu nennen ist echt nen Witz...

Außerdem war die FPU der K6 der große Schwachpunkt.
Das galt aber nicht für den 3DNow! Code, weil dieser hatte afaik eine Pipeline.
Bei x87 ist das schwierig, deshalb hat es AMD wohl so lange nicht gehabt

Außerdem ist 3Dnow für wissenschaftliche Großrechner sehr interessant. Solche Rechner werden für Klimforschung etc. eingesetzt und sollen insbesondere wegen 3Dnow sehr mächtig sein.
Jo, nur ist leider im 64 bit Modus 3DNow! nicht mehr verwendbar, was gerade bei Klimaforschung wohl sehr oft verwendung finden wird wenn Opterons benützt werden ;)

Also doch? Was für ne Verschwendung.
Pff. Das sind nicht mal 3% DIE Fläche. Die Funktionseinheiten sind für SSE und 3DNow! die selben.

Und AMD64 erlaubt SSE UND SSE2, nicht nur SSE2 ...

ShadowXX

2004-02-03, 16:50:48

Original geschrieben von Coda
MMX gab's erst seit dem Pentium MMX nicht seit dem Pentium
3DNow! kann man kaum als Antwort auf MMX deuten, da es floats und keine interger berechnet
"3DNow Professional" aka 3DNow+ wie du es nennst ist SSE (1)
Und SSE3 SSE3 zu nennen ist echt nen Witz...

Jo, nur ist leider im 64 bit Modus 3DNow! nicht mehr verwendbar, was gerade bei Klimaforschung wohl sehr oft verwendung finden wird wenn Opterons benützt werden ;)

Pff. Das sind nicht mal 3% DIE Fläche. Die Funktionseinheiten sind für SSE und 3DNow! die selben.

Und AMD64 erlaubt SSE UND SSE2, nicht nur SSE2 ...

Zumindest mein P4 erlaubt auch SSE....

J.S.Shadow

Coda

2004-02-03, 16:51:45

Huh? Wo hab ich behauptet das er es nicht tut? Oo

ShadowXX

2004-02-03, 16:58:49

Original geschrieben von Coda
...
Und AMD64 erlaubt SSE UND SSE2, nicht nur SSE2 ...

Hab den Teil mal rausgeschnitten...hört sich zumindest im ersten Moment so an, als wenn der P4 "nur" SSE2 erlauben würde....

Habs wohl in den falschen Hals bekommen...

J.S.Shadow

Coda

2004-02-03, 17:00:40

Da ist noch nicht mal vom P4 die rede Oo

ShadowXX

2004-02-03, 17:04:16

Original geschrieben von Coda
Da ist noch nicht mal vom P4 die rede Oo

Wie gesagt...in den falschen Hals bekommen...

Nachdem ich das ganze nochmals gelesen haben, habe ich jetzt den Bezug des letzen Satzes gefunden...

J.S.Shadow

Gast

2004-02-03, 17:26:10

Original geschrieben von Coda
"3DNow Professional" aka 3DNow+ wie du es nennst ist SSE (1)
Und SSE3 SSE3 zu nennen ist echt nen Witz...

Komisch das ein Athlon Classic schon 3DNow+ hatte :lol:

Darkstar

2004-02-03, 17:35:12

Original geschrieben von Coda
Die Funktionseinheiten sind für SSE und 3DNow! die selben.Das scheint nicht nur bei AMD so zu sein. Bei Cyrix wechselte man innerhalb der C3-Linie vom Eden zum Nehemiah von 3DNow! auf SSE. Das war wohl nur möglich, weil sich die Implementierung ohne fundamentale Unterschiede realisieren ließ.

zeckensack

2004-02-03, 17:40:02

Original geschrieben von Gast
Komisch das ein Athlon Classic schon 3DNow+ hatte :lol: "3DNow! enhanced" bitte :)
Das sind
a)die fehlenden Teile von 3DNow, die ursprünglich von AMD gewollt waren, aber nicht umgesetzt wurden, weil andere Implementoren von 3DNow (sprich: Cyrix/IDT, heutzutage beides bei VIA) das zu kompliziert fanden. ZB PSWAPD, PFNACC, etc.
b)die "SSE-Instruktionen", die keine SSE-Register brauchen. Unter anderem PREFETCHNTA und Konsorten, aber auch echte MMX-Erweiterungen (die von Intel allerdings trotzdem unter dem SSE-Deckmantel liefen), wie MOVNTQ, MASKMOVQ, SFENCE, PSHUFW etc pp.

Klick (pdf) (http://www.amd.com/us-en/assets/content_type/white_papers_and_tech_docs/22466.pdf)

edit:
Auch bei AMD selbst herrscht offenbar Unklarheit über die genaue Bezeichnung dieser Erweiterung ...
In diesem PDF (http://www.amd.com/products/cpg/athlon/techdocs/pdf/22007.pdf) wird das Paket wieder aufgeteilt in "MMX Extensions" und "3DNow! Extensions". Anhang F.

Coda

2004-02-03, 17:45:09

Original geschrieben von Gast
Komisch das ein Athlon Classic schon 3DNow+ hatte :lol:
Ach das hat er gemeint, naja 3DNow+ hätte jetzt beides "Enhanced" und "Professional" bedeuten können.
Dann stimmt's natürlich

StefanV

2004-02-03, 17:47:37

Original geschrieben von GloomY
Erst mal was Grundsätzliches: Das Ding heisst "3DNow!" (mit Ausrufezeichen) und wurde mit dem K6-3D (K6 mit 3DNow!) eingeführt, nicht erst mit dem K6-2.

Öhm, Gloomy, K6-2 ist der Verkaufsnahme für den K6-3D...
Oder umgekehrt: K6-3D war der Entwicklungsname für das Produkt, da als K6-2 auf den Markt kam....

GloomY

2004-02-03, 18:04:37

Original geschrieben von zeckensack
"3DNow!" enthält ein Satzzeichen, und das halte ich für unverschämt, da es meinen Schreibfluss unterbricht ;)Ja, da stimme ich zu, dass dies nicht umbedingt optimal ist.
Original geschrieben von zeckensack
"K6-3D" birgt auch eine gewisse Verwechslungsgefahr mit dem K6-3, der natürlich ebenfalls 3DNow beherrscht, aber nicht der erste (AMD-)Prozessor war, der das konnte. Der sogenannte "K6-3D" hingegen ist der K6-2. Letzteres ist auch der offizielle (Verkaufs-)Name.Ok, das habe ich dann falsch in Erinnerung. Ich glaube ich habe das mit MMX verwechselt, da es beim K6 ja welche mit und ohne gab... :|

Ach ja: Dann für immer hinweg mit der "K6-3D" Bezeichnung ;)

edit:
Original geschrieben von Stefan Payne
Öhm, Gloomy, K6-2 ist der Verkaufsnahme für den K6-3D...
Oder umgekehrt: K6-3D war der Entwicklungsname für das Produkt, da als K6-2 auf den Markt kam.... Ich finde K6-2 deutlich passender, denn AMD hat ja bei diesem mehr geändert als nur 3DNow! implementiert.

zeckensack

2004-02-03, 18:08:44

Original geschrieben von GloomY
Ja, da stimme ich zu, dass dies nicht umbedingt optimal ist.
Ok, das habe ich dann falsch in Erinnerung. Ich glaube ich habe das mit MMX verwechselt, da es beim K6 ja welche mit und ohne gab... :|?(
Jeder K6 hatte MMX. Der K5 hatte es nicht.

Es gab nur ein paar kleine Streitereien mit Intel, ob man den Begriff "MMX" nun in der Werbung, bzw als Teil des Prozessor-Aufdrucks verwenden durfte. Können konnten sie's allerdings schon immer.
Aus demselben Grund hiess der Cyrix 6x86MX btw auch 6x86MX und nicht 6x86MMX ;)

Gast

2004-02-03, 18:19:57

Stimmt!
P.O.D. war mit dem K5 also nicht ,mit dem K6 aber gut zu spielen =)
PS. ... das waren noch Zeiten!
up

thop

2004-02-03, 18:26:11

Hmm ich glaub MMX hat da auch nicht viel genützt. Ich errinnere mich einmal Hexen (Quake Engine wenn mich nicht alles täuscht) mit nem K6 gespielt zu haben und das lief im Vergleich zum Pentium grauselig. Kann aber auch sein dass es der K5 war, bin mir nicht sicher.

BlackBirdSR

2004-02-03, 18:26:56

Original geschrieben von Gast
Stimmt!
P.O.D. war mit dem K5 also nicht ,mit dem K6 aber gut zu spielen =)
PS. ... das waren noch Zeiten!
up

ja P.O.D war geil.
Und ja, das waren noch Zeiten... als Falcon4 3x schneller lief mit MMX, man keine Wavetables mehr brauchte, weil MMX das Alles übernahm.. und Keiner so richtig kapierte, dass MMX nicht mit Fließkommawerten arbeiten konnte.
MMX war ja DER HYPE schlechthin..

BlackBirdSR

2004-02-03, 18:28:06

Original geschrieben von thop
Hmm ich glaub MMX hat da auch nicht viel genützt. Ich errinnere mich einmal Hexen (Quake Engine wenn mich nicht alles täuscht) mit nem K6 gespielt zu haben und das lief im Vergleich zum Pentium grauselig. Kann aber auch sein dass es der K5 war, bin mir nicht sicher.

Quake nutzt kein MMX, da FPU Berechnungen...
Darum hat dort der K6 auch so richtig verloren.. und der PPro die Muskeln spielen lassen.

Endorphine

2004-02-03, 18:35:32

Original geschrieben von BlackBirdSR
ja P.O.D war geil.
Und ja, das waren noch Zeiten... als Falcon4 3x schneller lief mit MMX, man keine Wavetables mehr brauchte, weil MMX das Alles übernahm.. und Keiner so richtig kapierte, dass MMX nicht mit Fließkommawerten arbeiten konnte.
MMX war ja DER HYPE schlechthin.. Für mich war MMX nicht nur Hype, sondern eine ganz neue Dimension für PC-Spiele. :)

Ungefähr 1996 hab' ich mein beschädigtes (scheiss Längsregler) i430VX-Billigboard samt K5-PR150 rausgeworfen und die AMD-Ära in meinem PC mit einem P166/MMX und einem guten Mittelklasse i430TX-Board beendet. Das war ein Unterschied wie Tag und Nacht. Nicht nur P.O.D., sondern beispielsweise auch NFS2 lief locker subjektiv doppelt so schnell. Keine Abstürze mehr, wunderbare Kompatibilität, keine schwankende Leistung wie beim K5 (Applikation 1 läuft gut - Applikation 2 ist Intel-optimiert und läuft schlecht). Dann wollte ich erst mal bis der Slot-A Athlon kam nur noch Intel. :D

Edit: Nicht das es falsch rüberkommt: mir ist klar, dass das wenig mit den MMX-Befehlen zu tun hat. ;)

BlackBirdSR

2004-02-03, 18:38:40

Original geschrieben von Endorphine
Für mich war MMX nicht nur Hype, sondern eine ganz neue Dimension für PC-Spiele. :)

Ungefähr 1996 hab' ich mein beschädigtes (scheiss Längsregler) i430VX-Billigboard samt K5-PR150 rausgeworfen und die AMD-Ära in meinem PC mit einem P166/MMX und einem guten Mittelklasse i430TX-Board beendet. Das war ein Unterschied wie Tag und Nacht. Nicht nur P.O.D., sondern beispielsweise auch NFS2 lief locker subjektiv doppelt so schnell. Keine Abstürze mehr, wunderbare Kompatibilität, keine schwankende Leistung wie beim K5 (Applikation 1 läuft gut - Applikation 2 ist Intel-optimiert und läuft schlecht). Dann wollte ich erst mal bis der Slot-A Athlon kam nur noch Intel. :D

und was soll das jetzt mit MMX zu tun haben? :kratz:

thop

2004-02-03, 18:38:42

P.O.D. war doch dieser Racer im Wipeout Stil oder nicht (nur mit Autos)? Ich glaube das wurde doch extra für MMX programmiert und war dann das Paradespiel. Das haben die sogar im Computerclub auf WDR gezeigt. Die beiden Wolfgangs waren da aber nicht so angetan von ;D

Endorphine

2004-02-03, 18:41:53

Original geschrieben von BlackBirdSR
und was soll das jetzt mit MMX zu tun haben? :kratz: Ich hab's schon editiert...

Muh-sagt-die-Kuh

2004-02-03, 19:04:06

Das schöne am Pentium MMX war doch sein doppelt so großer L1-Cache, nicht MMX selbst :D

Sk_Antilles

2004-02-03, 19:10:11

Ja, das war damals etwas eigenartig. Intel machte großen Reibach um MMX, aber im Endeffekt war es eher der größere Cache der die bessere Leistung im Vergleich zu den normalen Pentium brachte.

Lokadamus

2004-02-03, 19:34:31

Original geschrieben von Coda
MMX gab's erst seit dem Pentium MMX nicht seit dem Pentium
3DNow! kann man kaum als Antwort auf MMX deuten, da es floats und keine interger berechnet
"3DNow Professional" aka 3DNow+ wie du es nennst ist SSE (1)
Und SSE3 SSE3 zu nennen ist echt nen Witz...
mmm...

Pentium MMX basiert auf dem P1, die Leistungen wurden mit 10 % mehr angegeben, finde nicht, das es besonders erwähnenswert ist, ansonsten müsste ich noch reinschreiben, das beim 486 der Co-Prozessor bei der DX-Reihe dabei war, während er bei der 486 SX fehlte/ als defekt galt ... wegen SSE 3, ich hab dem Teil nicht den Namen gegeben ;D, hätte es wohl eher SSE 2 + oder SSE 2 X (für eXetended) genannt, sieht aber dumm aus, wenn man die 2 dann weg nehmen würde ;) ...

robbitop

2004-02-03, 23:47:10

man glaubt es kaum, aber die FPU vom K6 soll schneller als die des P6 gewesen sein sein, jedoch war sie nicht "fully pipelined" dadurch das schlechte Endergebnis. (wie siehts eigentlich aus? schlägt der K6-2/3 den P4 in Punkto Pro Mhz Leistung? :D )

Quasar

2004-02-03, 23:50:30

Klingt nach 'nem Widerspruch "schneller aber schlechteres Endergebnis".... :gruebel:

Der King of Effizienz ist immer noch der Cyrix 6x86 :D
(bei irgendsoeinem Decypher-Project hatte er eine extrem hohe Integer-Leistung pro Takt. Besser als alles andere, was die so dagegen verglichen haben)

Kommt halt _immer_ drauf an, was man vergleicht.

BlackArchon

2004-02-04, 00:51:53

Original geschrieben von robbitop
...(wie siehts eigentlich aus? schlägt der K6-2/3 den P4 in Punkto Pro Mhz Leistung? :D ) Dazu fällt mir das ein: http://www.planet3dnow.de/cgi-bin/newspub/viewnews.cgi?category=1&id=1002460015

Dieser Effekt trat bei AMD erstmals beim K6-2/350 auf, bei Intel mit dem Pentium 4 2000. Böse Zungen würden jetzt behaupten, dass die beiden CPUs gleich schnell sind... *eg*

stickedy

2004-02-04, 01:16:46

Original geschrieben von Darkstar
Das scheint nicht nur bei AMD so zu sein. Bei Cyrix wechselte man innerhalb der C3-Linie vom Eden zum Nehemiah von 3DNow! auf SSE. Das war wohl nur möglich, weil sich die Implementierung ohne fundamentale Unterschiede realisieren ließ.
Es gibt kein Cyrix mehr!! Die C3-CPUs stammen von Centaur und haben nichts, aber auch gar nichts mit den alten Cyrix-CPUs gemeinsam!
Außerdem war der Wechsel von Ezra(-T) zu Nehemiah. Trotz des gleichen Verkaufsnamens ist der Nehemiah aber eine andere CPU als der Ezra, halt eine Generation weiter. Ich sehe da keinen Zusammenhang, das 3DNow! und SSE keine fundamentalten Unterschiede hätten..

stickedy

2004-02-04, 01:18:17

Original geschrieben von GloomY
Ich finde K6-2 deutlich passender, denn AMD hat ja bei diesem mehr geändert als nur 3DNow! implementiert.
Nein, haben sie im Prinzip nicht. Man hat halt noch den FSB auf 100 MHz erhöht, das wars. Die Architektur des K6 und K6-2 ist identisch. Der K6-III bis auf den integrierten L3-Cache auch...
Aber Intel hat das mit dem Pentium II und III ja auch net anders gemacht..

Endorphine

2004-02-04, 01:57:56

Original geschrieben von Darkstar
Das scheint nicht nur bei AMD so zu sein. Bei Cyrix wechselte man innerhalb der C3-Linie vom Eden zum Nehemiah von 3DNow! auf SSE. Das war wohl nur möglich, weil sich die Implementierung ohne fundamentale Unterschiede realisieren ließ. Noch ein wenig zusätzliche Aufklärung zu dem was stickedy bereits sagte:
• Cyrix gehört mittlerweile zu VIA, ebenso wie Centaur.
• Die C3-Linie besteht aus Kernen, die heute bei Centaur entwickelt werden. Aktuell ist der C5XL "Nehemiah", der SSE spricht, aber kein 3Dnow! mehr. Der Nehemiah wird sowohl im VIA C3 als auch im VIA Eden eingesetzt.
• Der Vorgänger des C5XL Nehemiah war der C5C Ezra, der noch kein SSE verstand, dafür aber auch 3dnow!. Auch den Ezra-Kern gab es im VIA Eden als auch im VIA C3.
• Der Nehemiah-Nachfolger heisst bei Centaur C5I "Esther" und wird auch den SSE2-Befehlssatz beherrschen sowie auf dem P4/P-M Bus aufsetzen.

GloomY

2004-02-04, 04:53:49

Original geschrieben von zeckensack
Jeder K6 hatte MMX. Der K5 hatte es nicht.

Es gab nur ein paar kleine Streitereien mit Intel, ob man den Begriff "MMX" nun in der Werbung, bzw als Teil des Prozessor-Aufdrucks verwenden durfte. Können konnten sie's allerdings schon immer.
Aus demselben Grund hiess der Cyrix 6x86MX btw auch 6x86MX und nicht 6x86MMX ;) Also ich weiss nicht, was ich da in Erinnerung hatte, aber irgendwas war da...

Es ist normalerweise schon sehr selten, dass ich etwas kompett falsch in Erinnerung habe... ;(
Original geschrieben von robbitop
man glaubt es kaum, aber die FPU vom K6 soll schneller als die des P6 gewesen sein sein, jedoch war sie nicht "fully pipelined" dadurch das schlechte Endergebnis. (wie siehts eigentlich aus? schlägt der K6-2/3 den P4 in Punkto Pro Mhz Leistung? :D ) Was reine FPU Leistung angeht, so bin ich mir nicht sicher. Bei Integer Berechnungen (pipelined :) ) macht der K6 garantiert mehr pro Takt als der P4. Er schafft sogar mehr als der Duron, welcher ja bis auf den Cache den Athlon Core besitzt...
Original geschrieben von stickedy
Nein, haben sie im Prinzip nicht. Man hat halt noch den FSB auf 100 MHz erhöht, das wars. Die Architektur des K6 und K6-2 ist identisch. Der K6-III bis auf den integrierten L3-Cache auch...
Aber Intel hat das mit dem Pentium II und III ja auch net anders gemacht.. Imho hat AMD den Zugriff auf die FPU Register vereinfacht. Diese waren vorher irgendwie also FIFO organisiert, wobei man sehr viel Zeit mit dem Umsortieren beschäftigt war. Mit dem K6-2 konnte man dann direkt darauf zugreifen.

Wenn ich das (hoffentlich) diesmal richtig in Erinnerung habe...
Ich werd's bei Gelegenheit mal aus alten Zeitschriften raussuchen :)

diedl

2004-02-04, 06:03:04

habe mal ein paar alte Sachen rausgekramt.
3DNow! Überblick, Analyse und Prognosen
der 3DNow!-Technologie auf
http://www.weblearn.hs-bremen.de/risse/RST/WS98/AMD_K6_2/amd_k6_2.htm

außerdem noch ein paar ältere Tests usw. die sich mit 3DNow! beschäftigen.
http://www.heise.de/ct/97/05/154/

http://www.heise.de/ct/99/05/118/

http://www.syssoft.uni-trier.de/systemsoftware/Download/Seminare/Prozessorarchitekturen/Prozessorarchitekturen-3.html

mfg diedl

Tomi

2004-02-04, 07:53:33

Quake 2 war meiner Erinnerung nach das einzigste Spiel, welches mittels 3DNow Patch merklich beschleunigt wurde. Kein Wunder, denn der Patch wurde damals von AMD entwickelt, um die Leistungsfähigkeit von 3DNow zu demonstrieren. Im Gegensatz dazu verwundern auch nicht die ebenso verwunderten Kommentare in den Reviews, dass sich trotz 3DNow Unterstützung bei anderen Spielen nichts großes täte. Für den Spielesektor ist 3DNow im Prinzip als Marketing Gag untergegangen. Nicht viel anders ging es aber Intel mit MMX und SSE.

BlackBirdSR

2004-02-04, 08:17:59

Original geschrieben von robbitop
man glaubt es kaum, aber die FPU vom K6 soll schneller als die des P6 gewesen sein sein, jedoch war sie nicht "fully pipelined" dadurch das schlechte Endergebnis. (wie siehts eigentlich aus? schlägt der K6-2/3 den P4 in Punkto Pro Mhz Leistung? :D )

Die FPU war nicht schneller (relativ)
Allerdings waren die Latenzen niedriger als beim Pentium.

Wenn Intel's Pipelining dann wiedermal Mist baute, konnte es passieren dass der K6 an den P5 rankam, was pure FPU Leistung angeht. Das war aber ganz selten :)

2004-02-04, 10:03:01

2004-02-04, 10:08:33

Darkstar

2004-02-04, 11:09:39

Original geschrieben von Endorphine
Ungefähr 1996 hab' ich mein beschädigtes (scheiss Längsregler) i430VX-Billigboard samt K5-PR150 rausgeworfen und die AMD-Ära in meinem PC mit einem P166/MMX und einem guten Mittelklasse i430TX-Board beendet. Das war ein Unterschied wie Tag und Nacht.War irgendwie typisch für diese Zeit: Anwender kauften damals Billig-Boards mit AMD/Cyrix-CPU und beschwerten sich, daß die Rechner langsamer und instabiler liefen als die Kombination Markenboard + Intel-CPU. :|Original geschrieben von stickedy
Es gibt kein Cyrix mehr!! Die C3-CPUs stammen von Centaur und haben nichts, aber auch gar nichts mit den alten Cyrix-CPUs gemeinsam!Anfangs wurden von VIA auch die Centaur-CPUs unter der Marke Cyrix vertrieben.
Außerdem war der Wechsel von Ezra(-T) zu Nehemiah. Trotz des gleichen Verkaufsnamens ist der Nehemiah aber eine andere CPU als der Ezra, halt eine Generation weiter. Ich sehe da keinen Zusammenhang, das 3DNow! und SSE keine fundamentalten Unterschiede hätten.. Hast Recht, da habe ich was durcheinandergebracht.

robbitop

2004-02-04, 11:50:32

@stickedy du meinst L2 Cache? ;) (beim K6-3)

stickedy

2004-02-04, 14:50:00

Ja, ich meinte L2-Cache. Sorry. Heutzutage ist man ja onBoard L2-Cache schon gewöhnt ;)

Der erste K6-2 und der K6 waren bis auf 3DNow! und dem FSB100 identisch. Da gabs es keinerlei Geschwindigkeitsunterschied. Mag sein, dass AMD die FPU-Einheit wegen 3DNow! etwas umbauen mußte, aber ein großer Wurf war das auf jeden Fall nicht...

@Darkstar
Mag sein, dass die ersten C3s als Cyrix III verkauft wurden, trotzdem gibt es kein Cyrix mehr.
Die Aktion damals war ja auch eher aus der Not geboren, da der Joshua(Cyrix Goby/Cayenne) dermaßen schlecht war, das man ihnnicht verkaufen konnte, aber die ganze Welt schon auf den Cyrix III vorbereitet wurde...