PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Post-K Prototype auf der ISC


Skysnake
2018-06-23, 12:45:39
Der Titel sagt eigentlich schon alles. Fujitsu zeigt auf der ISC nächste Woche einen Post-K Prototype.

Wenn jemand da ist, kann er es sich ja mal anschauen. Ich werde selbst da sein, muss aber schauen ob ich genug Zeit dafür finde.

Ansonsten falls es noch was interessantes auf der ISC gibt, gerne hier Posten

Btw hier noch der Link zur Nachricht

https://www.hpcwire.com/off-the-wire/fujitsu-completes-post-k-supercomputer-cpu-prototype-begins-functionality-trials/

Demogod
2018-06-23, 13:10:22
wollt grad sagen: n paar infos kannste ja ruhig noch dazuschmeissen, damit man sich nicht alles selber googlen muss ^^


Major Specifications for Post-K
Category Details
CPU Instruction set architecture Armv8-A SVE (512bit)
Number of cores Computational nodes: 48 cores + 2 assistant cores
I/O and computational nodes: 48 cores + 4 assistant cores
Built-in interconnect Tofu (6D Mesh/Torus)
System structure Nodes 1 CPU/node
Racks 384 nodes/rack
Software OS Linux (RHEL-based) + McKernel (Lightweight Kernel)
System software Successor to the Fujitsu Software Technical Computing Suite
Global file system FEFS (Lustre-based)
Language Successor to the Fujitsu Software Technical Computing Language (Fortran/C/C++, OpenMP, MPI), XcalableMP
Library framework FDPS (Framework for Developing Particle Simulator)

also ein custom v8 arm mit 512bit vector registern??

Skysnake
2018-06-23, 13:55:16
Die Infos habe ich bewusst nicht reingepackt, da Sie meiner Meinung nach noch nicht wirklich stichhaltig sind.

Das es ARM mit nen fetten SIMD Unit wird war klar. Wobei es auch 1024 oder gar 2048 werden könnten. Die ARM ISA ist diesbezüglich ziemlich flexibel.


EDIT:
Vielleicht will ja aber Löschzwerg was dazu schreiben ;)

Btw. aufgrund der Bilder im Artikel wäre ich erstmal vorsichtig, wie der Interconnect aussieht. Für mich sieht die Anschlussleiste hinten nicht unbedingt üppig aus. Könnte mir gut vorstellen, dass Sie was am Interconnect geändert haben, zumal meine HandsOn Experience mit dem Vorgänger jetzt nicht sonderlich berauschend war. Also insbesondere der Interconnect hat mich jetzt nicht wirklich umgeworfen.

Loeschzwerg
2018-08-22, 10:00:07
Beitrag von der Hot Chips 2018:
https://www.anandtech.com/show/13258/hot-chips-2018-fujitsu-afx64-arm-core-live-blog

Das Kind nennt sich A64FX. Edit: HMC raus, HBM2 rein ^^

Skysnake
2018-08-22, 19:18:58
Das kein HMC drin ist war schon vorher klar. HMC ist einfach tot.

HBM2 ist aber schon eine Überraschung auf der ISC hieß es zu mit es wäre kein HBM....

Und 2021 HBM2 mit nur 1 TB/s ist auch ein schlechter Scherz. Tofu sieht jetzt auch nicht so kann alle aus mit den 28Gbps. Damit verdoppelt man zwar die Bandbreite für große Messages aber daran hat es auch Tofu2 schon nicht geangelt. Bei kleinen und die mittleren Messages war das Ding einfach zu langsam. Und von ihrem komischen 6d Ding bin ich irgendwie gar nicht angetan

Loeschzwerg
2018-08-22, 19:53:07
Tja, wirklich mehr Infos habe ich aktuell auch nicht. Bis das Thema in die GS21 Systeme reinschwappt, da vergeht noch einiges an Zeit.

Skysnake
2018-08-22, 20:08:18
Ich muss mir die Slides mal noch ganz genug anschauen aber für klassisches hpc sieht es nicht so berauschend aus. Aber immerhin mal vom HMC weg.

Richtig Leistung scheint es aber nur in AI Depp Learning zu geben. Naja, b in mal gespannt was da noch so kommt.

Aber 48 Cores bei noch immer 32 GB RAM sind jetzt nicht sooo der Knaller.

4 MPI-Prozesse mit je 12 Threads sehen recht vernünftig aus.

Ich hoffe nur die Software Tools zum optimieren werden deutlich besser. Das war ja mit fx100 in meinen Augen wirklich haarsträubend.... tools die auf Windows laufen und von der Funktionalität so 2000er sind... Das war echt abschreckend. Hier erhoffe ich mir echt am meisten von Umstieg auf arm

Loeschzwerg
2018-08-22, 20:13:29
tools die auf Windows laufen und von der Funktionalität so 2000er sind...

Kenne ich, da ist bei den Japanern in vielen Bereichen die Zeit stehen geblieben :D

Loeschzwerg
2018-08-23, 12:45:47
Ein kurze Zusammenfassung von Golem zum A64FX:
https://www.golem.de/news/a64fx-fujitsu-erlaeutert-arm-chip-fuer-japans-supercomputer-1808-136146.html

Thx @ Marc

Skysnake
2018-09-16, 10:17:41
https://www.nextplatform.com/2018/09/14/slicing-into-the-post-k-supercomputers-tofu-d-interconnect/

Geht es nur mir so,oder findet sonst noch jemand die Argumentation des Redakteurs ziemlich verrückt mit der Bisectionsbandbreite?

Ich will doch eine Bisectionsbandbreite die Unterlagen Bereich der injection bandwidth ist da das Mapping der Prozesse auf die nodes kacke egal ist...

Das macht den Job für die Entwickler und auch für den Job sheduler einfacher.

Also Tofu D überzeugt mich jetzt wieder nicht im Vergleich zu Aries.

Interessant wird halt das weitere Material und echte Benchmarks.

Und ja viele Probleme lassen sich auf nearest neighbour Mappen. Aber es gibt auch viele Probleme bei denen man allreduce mit scatter braucht oder halt auch entfernte Knoten braucht zur Kommunikation.

Zudem empfand ich das Job placement auf der fx100 mit tofu2 echt ziemlich sperrig. Da muss man echt aufpassen was man macht.

Und am Ende findet dann drr sheduler schwieriger entsprechende Knoten was den Durchsatz bzw die Auslastung der Maschine reduziert.