PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Intel Extensions AVX10/APX


ryan
2023-07-24, 23:45:42
AVX10 als Nachfolger für AVX512:



Today we are announcing the most impactful vector ISA evolution since the introduction of Intel AVX-512: Intel Advanced Vector Extensions 10 (Intel AVX10). Intel AVX10 includes all the capabilities and features of the Intel AVX-512 ISA, both for processors that feature 256-bit maximum vector register sizes, as well as for processors that feature 512-bit vector registers. In addition, this ISA includes several new capabilities and supports a new enumeration scheme that reduces the number of CPUID feature flags needing to be checked for feature support. Intel AVX10 is designed to run on future Intel P-core and E-core-based processors, allowing applications to seamlessly move across platforms.

There are three motivating factors for Intel AVX10:

1. To continue to support a high performance, vector ISA with all the richness of features of the existing Intel AVX-512 ISA.
2. To create a converged vector ISA based on Intel AVX-512 that will be supported on all future Intel processors.
3. To ease the developer task of verifying CPUID feature support.


https://abload.de/img/1aifgr.png

https://abload.de/img/259inb.png


https://cdrdv2-public.intel.com/784343/356368-intel-avx10-tech-paper.pdf

Intel Advanced Performance Extensions APX:

Today, we are introducing the next major step in the evolution of Intel® architecture. Intel® Advanced Performance Extensions (Intel® APX) expands the entire x86 instruction set with access to more registers and adds various new features that improve general-purpose performance. The extensions are designed to provide efficient performance gains across a variety of workloads – without significantly increasing silicon area or power consumption of the core.

Intel®Advanced Performance Extensions (Intel® APX) expands the Intel® 64 instruction set architecture with access to more registers and adds various new features that improve general-purpose performance. The extensions are designed to provide efficient performance gains across a variety of workloads without significantly increasing silicon area or power consumption of the core.

The main features of Intel® APX include:

• 16 additional general-purpose registers (GPRs) R16–R31, also referred to as Extended GPRs (EGPRs) in this document;
• Three-operand instruction formats with a new data destination (NDD) register for many integer instructions;
• Conditional ISA improvements: New conditional load, store and compare instructions, combined with an option for the compiler to suppress the status flags writes of common instructions;
• Optimized register state save/restore operations;
• A new 64-bit absolute direct jump instruction.


https://www.intel.com/content/www/us/en/developer/articles/technical/advanced-performance-extensions-apx.html

Darkman.X
2023-07-25, 01:38:45
Für den Consumer leider total irrelevant. Erstmal braucht es wieder Jahre, bis es in normalen Programmen abseits von Benchmarks / Wissenschaftskram angewendet wird. Es hängt auch davon ab, ob AMD mitmacht.
Und es gibt noch nicht mal AVX512 für den Intel-Consumer. 1-2 CPU-Generationen vor Alder Lake konnten es, aber mit Alder Lake wurde es, wenn ich mich richtig erinnere, mit einem Microcode/BIOS-Update deaktiviert. Vor dem Update konnte man AVX512 aktivieren, wenn man die E-Cores im BIOS deaktiviert hatte.

So aus meiner Sicht als Consumer. Ich kann nicht beurteilen, wie geil die neue Extension aus technischer Sicht ist. Was ich mich ja frage: Wird der Stromverbrauch / die Hitzeentwicklung damit noch schlimmer als bei AVX512, so dass die CPU bei Anwendung von AVX10 noch weiter heruntergetaktet werden muss?

Tobalt
2023-07-25, 06:13:21
Für den consumer und leichte Produktivprogramme sehe ich generell nicht so die relevanz von AVX512.

Wenn man Vector power braucht, dann doch eigentlich so kontinuierlich dass man über VRAM und GPU gehen kann 🤔

Ganon
2023-07-25, 07:37:56
Intel APX ist im Grunde ein neues ISA und hat sich etwas bei ARM bedient. D.h. wenn der Kernel und die Compiler soweit sind, könnte man es z.B. im Linux Bereich als neue Architektur mit aufnehmen, alle Programme neu kompilieren und profitiert praktisch sofort davon.

Hikaru
2023-07-25, 16:14:18
Für den consumer und leichte Produktivprogramme sehe ich generell nicht so die relevanz von AVX512.


Emus auf Zen4 zocken und alles hochskalieren/aufdrehen können bis zum Anschlag, dafür ist das wunderbar. Wird's aber im PC Gaming wohl niemals geben, weil Intel. bei denen ist das so: Friss oder stirb. AVX10 wird nicht anders sein. AMD: Wir schauen was die devs wirklich wollen und tunen das ein wenig.

Ganon
2023-07-25, 16:27:13
Emus auf Zen4 zocken und alles hochskalieren/aufdrehen können bis zum Anschlag, dafür ist das wunderbar.

Ich hoffe, dass sie bei APX mitmachen. Gerade für Emulatoren sind 32 GPR super, da Konsolen/Handhelds gerne auf Architekturen basieren, die ~32 GPRs haben.

Hikaru
2023-07-25, 17:38:15
Ich hoffe, dass sie bei APX mitmachen. Gerade für Emulatoren sind 32 GPR super, da Konsolen/Handhelds gerne auf Architekturen basieren, die ~32 GPRs haben.

Die Sache ist nicht ob das von den Emus unterstützt wird sondern ob Intel das für consumer freigibt, was nicht der Fall sein wird. Laut dem "AVX512 Autor aller Emus" war AVX512 schon integriert/miteinbezogen bevor es überhaupt in Silizium gegossen wurde und somit kann es sehr wohl sein das AVX10 mit an Bord sein wird.

Er hat auch das AMD AVX512 gelobt weil es so effizient sei und ebenso wegen anderen Sachen. Kann mir keiner erzählen das AMD von Emulation die davon profitiert nichts wusste. Ist RPCS3 nicht mittlerweile ein Benchmark bei (hab ich jetzt vergessen)? Nur hier kannste deine CPU in 4k ein wenig ins Schnaufen bringen
oder downsamplen das es kracht.

Übrigens 3D cache bringt nichts. Nur Takt und schneller DDR5 RAM zählt. 8 Kerne ist der sweetspot, also 7700X.

Zossel
2023-07-27, 06:58:52
https://www.3dcenter.org/news/news-des-25-juli-2023Damit wird es dann auch möglich, AVX512 (in Form von AVX10) auf Prozessoren mit nur 256-bittigen FPUs auszuführen – was den Weg dafür freimacht, die neueste AVX-Version zukünftig wieder auf allen Intel-Architekturen zu sehen. Damit sind speziell Intels E-Kerne gemeint, welche nur AVX256 (AVX2) beherrschen, da die für AVX512 (bislang) benötigten 512-bittigen FPUs schlicht als zu fett für E-Kerne gelten.Das ist Unfug, jetziges AVX512 läuft bereits auf real existierenden 256-bittigen FPUs bzw. ALUs, siehe AMD.
Intel hat es verkackt AVX512 als neue Baseline einzuführen, daran ändert auch Marketing-Sprech nichts.

Ganon
2023-07-27, 07:28:32
Die Sache ist nicht ob das von den Emus unterstützt wird sondern ob Intel das für consumer freigibt, was nicht der Fall sein wird.

Ich meine mit "Ich hoffe, dass sie bei APX mitmachen.", dass AMD das implementiert. Da kann es dir, wie bei AVX-512 egal sein, ob Intel das macht.

Mordekai2009
2023-07-31, 17:09:00
Es kommt mit der Zeit. Nur halt ein paar Jahre später.

Badesalz
2023-08-17, 19:44:22
Wir hatten hier schon Gespräche wo es sich bisschen zeigte, daß man nicht alles auf der GPU besser machen kann, wenn man sich wirklich richtig anschaut wie es auf AVX laufen würde. Allerdings sind Intels immer wieder neuen stummen Schreie nach Hilfe irgendwann auch ausgelutscht.

Das Thema 128bit/256bit war wirklich noch eins. Das lief noch nicht so schick (AMD). Aber nun bei 512bit, was sonst einiges mehr "kostet", hat AMD bestens gezeigt, daß man das mit 2x256 sehr elegant und vernünftig schnell machen kann. Jetzt jagt Intel die Sau nochmal durchs Dorf, diesmal mit Blumensträußen auf dem Rücken getackert.
Ja. Auch 2x256 wird mit AVX10 auch bei denen gehen. Wow.

APX dagegen ist vor allem und grundsätzlich, 32 GPRs. Welch ein Coup... Für Server-CPUs. Hätte AMD die Deutungshochheit hätten sie die Verbreitung nebenbei im Vorbeigehen implementiert. Intel ruft dann immer eine neue Ära der Komputertechnik aus :freak:

GHs (NV), MI300A, MI300X, Cerberos, FPGAs, adaptive SoCs, SOMs und bei CPUs klare Strukturierung in die 4 relevantesten Gruppen (sehe Zen4). Für den Großteil der restlichen Welt ist schon M2max zuviel. Das wars schon.

Und die, die in der Auflistung noch fehlen, die werden von Mainframes niemals abrücken :wink: