PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : AMD - Zen 5 (3/4 nm, 2024)


Seiten : 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 [21]

amdfanuwe
2025-01-29, 01:14:22
Viel spannender finde ich ob AMD das I/O-Die von dem Ding auch als diskrete GPU verhökern wird.
Vielleicht Defekte in einer kleinen Sonderserie. Kommt auch darauf an, welche Stückzahlen Strix Halo erreicht. Man will ja nach möglichkeit einen Maskensatz auch komplett nutzen.

MSABK
2025-01-29, 17:09:49
Jetzt mit DeepSeek bekommt der Strix Halo einr ganz andere Bedeutung. Damit wird der Chip interessanter.

Zossel
2025-01-29, 18:10:59
Jetzt mit DeepSeek bekommt der Strix Halo einr ganz andere Bedeutung. Damit wird der Chip interessanter.

Hmm, kann das Ding FP8? Und was braucht die Software?

FSR 4.0 KI-basiert ist und die GPU dafür den Datentyp FP8 beherrschen muss. Das ist erst ab RDNA 4 der Fall, RDNA 3 unterstützt FP16 und BF16, FP8 fehlt hingegen.

https://www.golem.de/news/radeon-rx-9060-und-9070-amd-fsr-4-0-kommt-nur-fuer-rdna4-2501-192855.html

Exxtreme
2025-01-29, 19:06:45
Hmm, kann das Ding FP8? Und was braucht die Software?



https://www.golem.de/news/radeon-rx-9060-und-9070-amd-fsr-4-0-kommt-nur-fuer-rdna4-2501-192855.html

Du kannst FP8 auch mit FP16-Registern berechnen. Kostet halt Performance.

Zossel
2025-01-29, 19:42:58
Du kannst FP8 auch mit FP16-Registern berechnen. Kostet halt Performance.

Schon klar, aber kann man einen Vektor "in einem Rutsch" von F8 nach FP16 umwandeln, bzw. beim laden/speichern konvertieren?
Und kann der Compiler das aus dem Zwischencode entsprechend "anpassen" oder braucht es eine Anpassung des Sourcecodes?

Es geht dabei um den genutzten Speicher/RAM und die Speicherbandbreite.
Ohne entsprechende Befehle dürfte die Performance auf einen Bruchteil absinken.

Konvertieren von FPn nach FPm ist ja lediglich das einfügen von 0-Bits bzw. das wegwerfen von Bits an den richtigen Stellen.

Oranje7
2025-01-29, 21:09:04
Hmm, kann das Ding FP8? Und was braucht die Software?



https://www.golem.de/news/radeon-rx-9060-und-9070-amd-fsr-4-0-kommt-nur-fuer-rdna4-2501-192855.html

Dafür gibt es doch extra die NPU im Chip...

Zossel
2025-01-29, 21:21:35
Dafür gibt es doch extra die NPU im Chip...

Das braucht wahrscheinlich einen richtigen Port um das an diese Architektur anzupassen:

https://www.amd.com/de/technologies/xdna.html

basix
2025-01-29, 21:57:59
Dauert wohl noch was, aber es kommt langsam für XDNA:
https://github.com/ggerganov/llama.cpp/issues/1499

Einige Sachen laufen bereits aber ist alles noch unfertig. Und keine Ahnung, ob das irgendwann in ROCm integriert wird oder wie das genau laufen soll.

Oranje7
2025-01-30, 10:39:15
https://github.com/amd/RyzenAI-SW?tab=readme-ov-file

Klar sollte dann die AI Software am Ende auch die NPU ansprechen und nicht Stumpf die GPU sonst spielt das nur Nvidea in die Arme