Archiv verlassen und diese Seite im Standarddesign anzeigen : SPARC64 VIIIfx - stromsparendes Leistungsmonster
8-Kern-Prozessor SPARC64 VIII verkündet, der mit 45-Nanometer-Fertigungstechnik auf 300-Millimeter-Wafern produziert werden soll. Demnach soll der Prozessor insgesamt 128 GFlops leisten, also ungefähr das 2,4-Fache der zurzeit leistungsfähigsten x86-CPU, Intels Core i7-965 mit 3,2 GHz (51,2 GFlops bei doppelter Genauigkeit, DP).
http://www.heise.de/bilder/137839/0/1
SPARC64 VIIIfx: 128-GFlops-CPU für japanischen Supercomputer:
http://www.heise.de/newsticker/SPARC64-VIIIfx-128-GFlops-CPU-fuer-japanischen-Supercomputer--/meldung/137839
Acht-Kern-CPU mit Leistung satt bei 35 Watt:
http://www.computerbase.de/news/hardware/prozessoren/2009/mai/acht-kern-cpu_leistung_35_watt/
Nun hat Fujitsu – bisher leider nur in japanischer Sprache – ein PDF-Handbuch zu der speziellen SIMD-Befehlssatzerweiterung HPC-ACE des SPARC64 VIIIfx veröffentlicht. Diese Arithmetic Computational Extensions für das High Performance Computing stehen zusätzlich zu den SPARC-V9-Befehlen bereit.
-> Werden die 128-GFlops über eine SIMD-Einheit erreicht?
Fujitsu hält es auch für möglich, Venus in den nächsten Jahren für den Mainstream-Markt tauglich zu machen, man müsse die Möglichkeiten prüfen, heißt es auf pc.watch.impress.co.jp.
http://www.pcgameshardware.de/aid,684512/Fujitsu-stellt-angeblich-schnellste-CPU-der-Welt-vor/CPU/News/
The Japanese electronics giant also says it hasn't ruled out adapting its CPU from one used only by the supercomputer industry to one more suited to mainstream computing applications available to mass market consumers.
http://www.theinquirer.net/inquirer/news/1137342/fujitsu-unveils-world-s-fastest-cpu
Spasstiger
2009-05-16, 14:15:54
Wie hoch soll denn der Takt liegen? Finde dazu keine Angabe.
Bei dem niedrigen Verbrauch denke ich, dass der Takt unter 3 GHz liegt.
Denkbar wären 2 GHz (= 8 DP-Operationen pro Kern und Takt) oder 2,67 GHz (= 6 DP-Operationen pro Kern und Takt).
/EDIT: Der SPARC64 VII schaffte noch 4 DP-Ops pro Takt und Kern. Aber wenn man diese Architektur einfach auf 8 Kerne hochskaliert hätte, müsste man den Prozzi mit 4 GHz takten, um auf 128 GFlops zu kommen. Mit 4 GHz kann ich mir eine TDP von 35 Watt aber nur schwer vorstellen.
mboeller
2009-05-16, 18:11:53
Der Takt liegt wahrscheinlich bei 2Ghz:
128GFlops / 8 Cores / 4FMACs/core/Hz = 2 GHz (1MAC = 2 Flops)
nicht mehr als eine Schätzung aber imho eine vernünftige
/EDIT: Der SPARC64 VII schaffte noch 4 DP-Ops pro Takt und Kern. Aber wenn man diese Architektur einfach auf 8 Kerne hochskaliert hätte, ...
Hat man eben nicht, sondern man hat ne Vektor Einheit mit 512 64bit Registern angeflanscht ... das, plus die schon erwähnten, neuen FMA Instruktionen ergibt ein schönes Leistungsplus ;)
Die Rechnung von mboeller schaut ganz gut aus ;-)
Wenn es für das Teil noch nen x86 Emulator gäbe, wärs vielleicht sogar Nischenmarkttauglich ... mit den ganzen Registern und den 8 Kernen sollte man schon ne vernünftige Leistung erreichen können :D
Steht eigentlich irgendwo etwas zur DIE Größe ?
Edit:
Gerade gesehen, pcgh schreibt was von 2 cm² also 200mm²... das wäre ja ein Witz, K10 und Nehalem liegen um 250mm².
Das liegt teilweise sicherlich am fehlenden L3 Cache .. aber trotzdem, sind ja 8 Kerne.
ciao
Alex
AnarchX
2009-05-16, 20:58:25
Edit:
Gerade gesehen, pcgh schreibt was von 2 cm² also 200mm²... das wäre ja ein Witz, K10 und Nehalem liegen um 250mm².
Der Chip auf den gezeigten Wafern hat ganz klar eine Kantenlänge >=2cm, also wohl eher in Richtung 400-500mm².
edit: besseres Bild: http://pc.watch.impress.co.jp/img/pcw/docs/168/533/html/803.jpg.html
Damit kann man ihn eher als Konkurrenz zu Beckton/Nehalem-EX mit seinen >85GFLOPs sehen, wenn auch dieser nicht nur 35W verbraucht, aber dafür andere Stärken hat.
Wenn es für das Teil noch nen x86 Emulator gäbe, wärs vielleicht sogar Nischenmarkttauglich ... mit den ganzen Registern und den 8 Kernen sollte man schon ne vernünftige Leistung erreichen können :D
Hallo,
das ging (bzw.geht) schon beim Itanium schief.
Diese CPUs brauchen einfach angepassten Code sonst dümpeln die nur vor sich hin.
Wenn es für das Teil noch nen x86 Emulator gäbe, wärs vielleicht sogar Nischenmarkttauglich ... mit den ganzen Registern und den 8 Kernen sollte man schon ne vernünftige Leistung erreichen können :D
qemu zum Beispiel.
http://packages.debian.org/search?keywords=qemu
zumindest gibts ein Debian Paket für sparc
deekey777
2009-05-29, 22:21:24
http://www.heise.de/ct/Von-Feuer-und-Flamme--/prozessorgefluester/138087
Die SPARC-Linie – so Oracle-Chef Larry Ellison – soll zusammen mit Fujitsu weiterentwickelt werden. Hier gibt’s zum einen die Sun-Entwicklung Rock, die im Verlaufe dieses Jahres debütieren soll – und vor allem die SPARC64-Linie, die in Version VIIIfx (Venus) auf dem Fujitsu-Forum 2009 als Prototyp vorgestellt wurde. Mit acht Kernen und vier Speichercontrollern (gefertigt in 45-nm-Technik) sollen sie mit ihrer erweiterten Vektoreinheit bis zu 128 GFlops leisten können und dabei angeblich nur ein Drittel des aktuellen SPARC64-VII-Chips verbrauchen. Wahrscheinlich meinte aber Fujitsu-Sprecher Masao Sakamoto dabei – so wie bei früheren Angaben von Fujitsu üblich – den Verbrauch pro Kern, sodass der Prozessor dann insgesamt auf etwa 90 Watt käm
(del)
2009-05-30, 02:43:10
Wer hat denn an die 35W hier geglaubt? :crazy2:
Trotzdem ist das Ding mit 90W und dieser Leistung ohne Frage der Hammer. Nicht aber so ein Hammer wie der Niagara, wenn es um Server geht :tongue:
Spasstiger
2011-06-21, 10:36:18
K Computer, der neue Spitzenreiter unter den Supercomputern bei top500.org, setzt auf 68544 SPARC64-VIIIfx-CPUs mit jeweils 2 GHz Takt und 8 Kernen (128 GFlops pro CPU): http://www.top500.org/lists/2011/06/press-release.
Zusammen bringen es die 548352 Cores auf 8160 Teraflops gemessene Rechenleistung (Linpack), das System hat eine Leistungsaufnahme von 9,89 Megawatt. Damit bringt es das System auf eine Energieeffizienz von 825 MFlops/Watt, was deutlich über dem Schnitt der Top500 (248 MFlops/Watt) liegt und womit es in den Top10 nur vom GPU-gestützten TSUBAME 2.0 (852 MFlops/Watt) geschlagen wird.
dildo4u
2011-06-21, 12:43:36
Sehr gute Energieeffizienz die Systeme mit NV GPUs leiden ja sicherlich durch die Intel CPUs die so viel verbrauchen,mal sehen ob man mit einer ARM GPU Kombination in näster Zeit an die 10 Petaflops ranreicht.
Jetzt kommt der Mythos wieder *sic*
Finch
2011-06-21, 14:05:18
Welcher Mythos?
Shink
2011-06-21, 15:15:16
Welcher Mythos?
Systeme mit NV GPUs leiden ja sicherlich durch die Intel CPUs die so viel verbrauchen,mal sehen ob man mit einer ARM
Der böse x86-Overhead verheizt mal wieder 90% der Leistung eines Großrechners.
:rolleyes:
PrefoX
2011-06-21, 15:44:40
ich hab gehört es sind nur 88% :)
Der böse x86-Overhead verheizt mal wieder 90% der Leistung eines Großrechners.
:rolleyes:
Untertreib mal nicht!
dildo4u
2011-06-21, 16:58:15
Der böse x86-Overhead verheizt mal wieder 90% der Leistung eines Großrechners.
:rolleyes:
Die Roadmap von NV zeigt doch klar der näste große Performance pro Watt Sprung kommt mit der ARM Nutzung.Wie kann Maxwell sich sonst so abheben?
http://www.golem.de/1009/78141.html
Die GFLops von Maxwell kommen sicher nicht durch den ARM-Kern X-D
dildo4u
2011-06-21, 17:06:10
Die GFLops von Maxwell kommen sicher nicht durch den ARM-Kern X-D
Das ist ein Performance pro Watt Chart. :rolleyes:
Das ist ein Performance pro Watt Chart. :rolleyes:
Das ist kein Widerspruch zu Codas Aussage.
dildo4u
2011-06-21, 17:24:54
Das ist kein Widerspruch zu Codas Aussage.
Warum ist der Sprung dann so groß und warum wird ausdrücklich Performance pro Watt erwähnt und nicht nur Performance?
Spasstiger
2011-06-21, 17:25:30
Der SPARC64 VIIIfx überzeugt auf jeden Fall im Supercomputereinsatz, Energieeffizienz auf oder sogar deutlich über Niveau der Fermi-Intel-Kombos ganz ohne GPU-Unterstützung. Allerdings dürfte der K Computer nicht ganz billig sein und wenns um Preis-Leistung geht, haben GPUs die Nase vorn. Insbesondere, wenn man auf AMD setzt. Ein gutes Beispiel dafür ist der LOEWE-CSC mit Opterons und Radeons. 285 TFlops für 5 Mio. Euro (1 (http://www.top500.org/system/performance/10591), 2 (http://www.pro-physik.de/Phy/leadArticle.do?laid=13506)). Sind also rund 17500€ pro installiertem TFlop.
Der K Computer leistet 8160 TFlops für 1250 Mio. US-$ = 870 Mio. Euro (Quelle (http://german.china.org.cn/international/2011-06/21/content_22829896.htm)), das entspricht 107000€ pro installiertem TFlop und somit dem sechsfachen des LOEWE-CSC.
Warum ist der Sprung dann so groß und warum wird ausdrücklich Performance pro Watt erwähnt und nicht nur Performance?
Okay, hast recht und ich meine Ruhe ;)
Gipsel
2011-06-21, 18:18:12
8-Kern-Prozessor SPARC64 VIII verkündet, der mit 45-Nanometer-Fertigungstechnik auf 300-Millimeter-Wafern produziert werden soll. Demnach soll der Prozessor insgesamt 128 GFlops leisten, also ungefähr das 2,4-Fache der zurzeit leistungsfähigsten x86-CPU, Intels Core i7-965 mit 3,2 GHz (51,2 GFlops bei doppelter Genauigkeit, DP).
Um mal kleinlich zu sein, die Zwölfkerner Opterons haben bei 2.3 GHz eine Peak-Leistung von 110,4 GFlop/s in DP. :rolleyes:
AnarchX
2011-06-21, 20:21:39
Den gab es aber 2009 noch nicht. ;)
SPARC64 VIIIfx ist 513mm² groß und benötigt 58W: http://www.hotchips.org/archives/hc21/3_tues/HC21.25.500.ComputingAccelerators-Epub/HC21.25.51A.Maruyama-Fujitsu-Octo-Core-VIIIfx.pdf S.12
Allerdings dürfte der K Computer nicht ganz billig sein und wenns um Preis-Leistung geht, haben GPUs die Nase vorn. Insbesondere, wenn man auf AMD setzt. Ein gutes Beispiel dafür ist der LOEWE-CSC mit Opterons und Radeons. 285 TFlops für 5 Mio. Euro (1 (http://www.top500.org/system/performance/10591), 2 (http://www.pro-physik.de/Phy/leadArticle.do?laid=13506)). Sind also rund 17500€ pro installiertem TFlop.
Der K Computer leistet 8160 TFlops für 1250 Mio. US-$ = 870 Mio. Euro (Quelle (http://german.china.org.cn/international/2011-06/21/content_22829896.htm)), das entspricht 107000€ pro installiertem TFlop und somit dem sechsfachen des LOEWE-CSC.
Endkunden-GraKas sind eben erheblich günstiger als HPC-Komponenten, fragt sich nur ob außerhalb des universitären Bereiches eine solche Lösung akzeptiert wird. Die Chinesen sind bei Tianhe auch von der 4870X2 auf Tesla M2050 umgeschwenkt.
Gipsel
2011-06-21, 20:45:12
Den gab es aber 2009 noch nicht. ;)Ooops, dachte der Thread wäre wegen dem K-Ding da in Japan neu :redface:
(del)
2011-11-04, 01:18:10
Das Teil ist nun "fertig". Haut 10 Petaflops raus, mit 864 Server-Racks und 88.000 CPUs.
http://winfuture.de/news,66390.html
vBulletin®, Copyright ©2000-2025, Jelsoft Enterprises Ltd.