PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Diskussion zu: Hardware- und Nachrichten-Links des 26./27. Februar 2019


Leonidas
2019-02-28, 08:10:38
Link zur News:
https://www.3dcenter.org/news/hardware-und-nachrichten-links-des-2627-februar-2019

Iscaran
2019-02-28, 09:45:13
Insofern ist es eher eine taktische Entscheidung AMDs, dies derzeit nicht zu tun – wahrscheinlich schlicht aus Performance-Gründen. Letztlich hat nVidia selbigen Fallbackmodus außerhalb seiner RayTracing-Beschleuniger nur bei der Titan V aktiviert, welche zum die Entwicklungs-Plattform für RayTracing war und zum anderen durch ihre pure Power immer noch eine passable RayTracing-Performance erreicht.


Lass diese unfundierten Spekulationen lieber:

Titan V hat bis auf 10-30% dieselbe RT-Leistung mit dem Modus wie die Titan RTX !!
https://www.3dcenter.org/news/raytracing-battlefield-v-laeuft-mit-guten-frameraten-auch-auf-der-titan-v

Soweit bisher bekannt liegt das daran das, dass RT über den Software modus von DXR wohl über die Double-Precision Leistung korreliert bzw. implementiert ist. Solange hier die Details jedoch unbekannt sind ist eine Spekulation von dir wie oben sehr gewagt und gegenüber AMD auch im "Wortlaut" sehr negativ.

https://www.researchgate.net/publication/263784958_GPU-accelerated_ray_tracing_for_optical_simulation_and_design
http://www.idi.ntnu.no/~elster/pubs/eurographics-ludvigsen-elster.pdf
http://www.breault.com/multimedia-gallery/double-precision-ray-tracing-asap-demo-movie

Es gibt aber schon längere Zeit Ansätze hier die HALF-Precision Einheiten einzusetzen. Die Aufgrund der besseren Verüfgbarkeit im Endeffekt auch 70-80% der Leistung von DP erreichen.
https://dspace.cc.tut.fi/dpub/bitstream/handle/123456789/23212/Koskela.pdf?sequence=1

Karte DP=FP64 HP=FP16 | Tensor =FP16 (nicht !=RT-Leistung !!) im erweiterten Sinn zusätzliche FP16 Leistung.
Titan V |6.1TFlops | 24.5 TFlops | 110.5 TFlops
RTX 2080 |0.28 TFlops | 17.8 TFlops | 71.3TFlops
Radeon VII | 3.5 TFlops | 27.6 TFlops
Vega 64 | 0.79 TFlops | 25.3 TFLops

Quellen für Flopsleistungen:
https://en.wikipedia.org/wiki/List_of_Nvidia_graphics_processing_units
https://en.wikipedia.org/wiki/List_of_AMD_graphics_processing_units

EDIT:
Titan RTX |0.39 TFlops | 24.9 TFlops | 99.5 TFlops
demnach hätte die RTX sogar deutlich weniger DP als die Titan V...allerdings eben 40% mehr "Tensor" Leistung was gut zum Performance Bild in RT-passt.
Allerdings würde demnach die DXR-Software variante @Titan V irgendwie über die Tensor Cores laufen, wenn auch nicht explizit in der Form wie in den RT-Cores.
Wahrscheinlicher jedoch ist das Titan V hier den "Umweg" über die DP-Leistung geht (denn dass die Titan V den Weg über die Tensor-Leistung geht erscheint aufgrund im direkten Vergleich niedrigeren Tensor-Leistungen bei den RTX Karten nicht sinnvoll)....die Tensor-Leistung demnach gar nicht relevant für den Vergleich ist.
Man könnte demnach mal in etwa umrechnen Die Titan RTX ist ja ca 30% schnelmit Tensor-RT als die Titan V mit DP-RT:
=> 99.5TFlops "Tensor-RT" = 100% RT Leistung
=> 6.1 TFlops DP = ~ 85% RT Leistung => 1% RT-Leistung über DP sind ca. 0.07 TFlops/% RT.
https://www.3dcenter.org/news/raytracing-battlefield-v-laeuft-mit-guten-frameraten-auch-auf-der-titan-v

Demnach hätte ein 1080 Ti ca 4-5% der RT-Leistung der Titan RTX.
Entsprechend Vega ca 10-11% und Radeon VII ca 49%
End of EDIT.



Je nachdem also was genau für RT über DXR-im Software Modus gebraucht/benutzt wird (HP oder DP) steht AMD ggf. gar nicht so schlecht dar. Wenn das über HP läuft sollten Vega und VII Karten sogar die RT-Leistung einer Titan V erreichen.
Wenn das über DP läuft (was ich aktuell annehme da die meisten Fallbeispiele dafür zu finden sind). Dann hätte eine VII immerhin 50% der Leistung einer Titan V...was zwar nicht reicht um RT in Games zu bringen (das wäre dann immernoch weniger als RTX2070 an RT Leistung
hätte).
Deswegen würde ich solange hier nichts näheres bekannt ist zu dem Software-Fallback mich mit derartig spekulative Aussagen zu vermeintlichen Gründen eher zurückhalten !

Gibt es denn andere Titan Karten die den Software-Fallback auch können oder nur die Titan V ?

Wenn es nur die V ist dann ist das für mich ein Zeichen dass man vor allem DP braucht.
Denn Titan X /Xp bzw 1080 Ti haben jeweils nur ~0.3 TF in DP !
Hätten aber immerhin ~11 TF in HP !

Der Hauptunterschied zwischen Titan V und 1080 Ti / Titan X (oder Xp) ist im wesentlichen die ca 20x-30x fach höhere DP Leistung.


WENN also DP für Software-DXR benutzt wird dann wäre eine Radeon VII immerhin bei ca 50% der Titan V bei RT-Software Leistungsmäßig zu verorten !

Die MI50/MI60 mit ihren massiven DP-Raten ~7TFlops müssten eigentlich sogar besser als die Titan V dann gehen !

Dino-Fossil
2019-02-28, 11:39:22
Bezüglich "Arcturus" als Next-Gen könnte man noch anmerken, dass das aktuell auf tönernen Füßen steht - die Aussage seitens AMD war, dass es sich dabei angeblich um individuelle Chip-Bezeichnungen für die Treiber-Entwicklung handelt, mit dem Ziel diese etwas klarer zu gestalten.
Vega insbesondere hatte ja das "Problem", dass es Vega10, sowie die APUs als Chip gab (und ursprünglich wohl noch weitere) und Vega 64/56/12/8/etc. als Marketing-Namen, was wohl zeitweise für Verwirrung sorgte.
So gesehen könnte Arcturus auch der Navi-Generation angehören.

Und wurde nicht irgendwo gemeldet, dass der Raytracing-Fallback Modus sowieso nicht länger gepflegt wird, sondern eher als Testmodus für die Entwickler gedacht war?

BeetleatWar1977
2019-02-28, 11:44:19
Software DXR: Float R32G32B32(und evtl noch A32)... Noch Fragen?

Gast Ritis
2019-02-28, 11:45:09
Thumbs up @iscaran.

Da die DP Beschränkungen bei eigentlich identischen Chips dem Vermuten nach "nur" Microcode-Fixes sind wäre es auch möglich per Microcode-Update nur bestimmte Shader für das Raymarching in DXR kompatiblen Treiber in entsprechenden Hardwareeinheiten bzw. Instruction Sets auszuführen.

Iscaran
2019-02-28, 14:42:58
Software DXR: Float R32G32B32(und evtl noch A32)... Noch Fragen?


Dann wäre dafür relevant die SP Leistung der Chips:
Name | DP | SP |HP | "Tensor"
Titan RTX |0.39 TFlops | 12.4 TFlops | 24.9 TFlops | 99.5 TFlops (Wobei hier natürlich die RT-Cores arbeiten und nicht die SP-Floats)
Titan V |6.1TFlops | 12.3 TFlops | 24.5 TFlops | 110.5 TFlops
RTX 2080 |0.28 TFlops | 8.9 TFlops | 17.8 TFlops | 71.3TFlops (Wobei hier natürlich die RT-Cores arbeiten und nicht die SP-Floats)
Radeon VII | 3.5 TFlops | 11.1 TFlops | 27.6 TFlops
Vega 64 | 0.79 TFlops | 10.2 TFlops |25.3 TFLops

Dann dürften die AMD GPUs sofern sie denn DXR unterstützen gar nicht so gravierend "schlecht" sein....immerhin hätten sie mehr SP-Leistung als z.B. die RTX 2080.

Wenn die Titan V das DXR-RTX über die SP-Leistung realisiert anstelle über die dedizierten RT-Cores dann dürften da Vega und VII nicht wesentlich schlechter abschneiden.

12.3 TFlops vs 10.1 TFlops (Vega64) bzw 11.2 TFlops (R VII)

EDIT: mal grob überschlagen wie oben wenn Titan V mit SP also 85% einer Titan RTX (mit RT-Cores) liefert entspricht 1% RT Leistung grob 0.144TFlops.
=> Vega = 10.1/0.144 = ~70% von Titan V = 0.7*0.85 = 59% einer Titan RTX
R VII = 11.2 / 0.144 = ~78% Titan V = 0.78*0.85= 66% einer Titan RTX.

Dino-Fossil
2019-02-28, 17:13:58
Nochmals zu Arcturus, hab hier was von brigdmanAMD (aus dem AMD-Linux-Treiber Team, glaube ich) auf reddit:
Just a reminder... the Arcturus code name refers to a specific chip, not an architecture. Somebody misread my post on Phoronix and thought it was a new architecture, and that has been echoing around the internet ever since.

Arcturus is just the first GPU we started after going back to using code names in the driver that are completely unrelated to the marketing name. The change should mean one less thing to worry about when we push Linux drivers out to a public repo on the way to upstream.

Natürlich könnte AMD Arcturus trotzdem für eine neue Chip-Arch verwenden, dann wäre das nur ein Versuch, das alles noch ein wenig im Dunkeln zu lassen.
Dennoch ist die offizielle Aussage bisher eher "Arcturus ist nicht die Gen nach Navi".

Gast Ritis
2019-02-28, 17:16:07
Software DXR: Float R32G32B32(und evtl noch A32)... Noch Fragen?

Die Frage wäre warum man für das RayMarching, das von den nVidia RT Cores beschleunigt wird, RGB(A) Werte übergeben und berechnen sollte?

Iscaran
2019-02-28, 20:32:11
Just a reminder... the Arcturus code name refers to a specific chip, not an architecture. Somebody misread my post on Phoronix and thought it was a new architecture, and that has been echoing around the internet ever since.

Arcturus is just the first GPU we started after going back to using code names in the driver that are completely unrelated to the marketing name. The change should mean one less thing to worry about when we push Linux drivers out to a public repo on the way to upstream.


Wenn wir mal annehmen, dass uns der Werte Herr nicht direkt anlügt bedeutet das einfach, dass AMD nunmehr wieder Sternnamen für einzelne Chips verwendet.

Damit wäre Arcturus schlicht der erste, bzw. einer der "Navi-Generation" Chips.

BeetleatWar1977
2019-03-01, 07:23:28
Die Frage wäre warum man für das RayMarching, das von den nVidia RT Cores beschleunigt wird, RGB(A) Werte übergeben und berechnen sollte?
Speicherformat für die Vektoren etc. Die Angabe ist so üblich, heisst halt 3(4) Kanäle mit je 32bit Breite.....

Gast Ritis
2019-03-01, 11:44:11
Speicherformat für die Vektoren etc. Die Angabe ist so üblich, heisst halt 3(4) Kanäle mit je 32bit Breite.....

Äh - schon, aber "berechnen"???

Wir wissen nicht genau wie Nvidia die RT-Cores tatsächlich bei der BVH Beschleunigung einsetzt.

Ich empfehle jedoch aufmerksames Lesen von Kapitel 4.2 in diesem Dokument:
https://research.nvidia.com/sites/default/files/publications/ylitie2017hpg-paper.pdf

Meine Vermutung liegt darin, dass für AI eine 8 Bit SIMD Beschleunigung optimiert wurde, die für die Gamer als RT-Cores im Marketing daherkommt.
https://devblogs.nvidia.com/mixed-precision-programming-cuda-8/
"TensorRT
TensorRT is a high-performance deep learning inference engine for production deployment of deep learning applications that automatically optimizes trained neural networks for run-time performance. TensorRT v1 has support for FP16 for inference convolutions, and v2 will support INT8 for inference convolutions."

Die RT-Cores könnten tatsächlich "nichts weiter" als einen auf eigene HW optimierten Softwarestack für quantisiert komprimierte 8bit weite Intersection Berechnungen in Nvidias BVH darstellen.


Soll mir mal jemand die ominösen Tensor und RT Cores im Die-Shot zeigen. Ach ja, da war ja was. Für die 72 RT Cores braucht es je 8 Tensor Cores.

Dieses ganze xy Cores Geschwurbel ist nichts anderes als besondere Instruktionsen für weiterentwickelte Shader Cores. Das läuft bei Intel und AMD im Marketing üblicher Weise unter Instruction Set Enhancements.
Wäre auch wirlich dämlich alle Welt würde plötzlich von AVX512 Cores sprechen müssen.

Bleibt für mich die Frage ob z.B. AMD mit ihren 8Int optimierten Vega-20 jemals einen Softwarestack für etwas ähnliches wie Nvidias BVH Variante zaubern können. Wohlmöglich gibt es da Patentprobleme, die erst einmal umschifft werden müssen.

Gast
2019-03-01, 12:19:52
Lass diese unfundierten Spekulationen lieber:

Titan V hat bis auf 10-30% dieselbe RT-Leistung mit dem Modus wie die Titan RTX !!
https://www.3dcenter.org/news/raytracing-battlefield-v-laeuft-mit-guten-frameraten-auch-auf-der-titan-v

Soweit bisher bekannt liegt das daran das, dass RT über den Software modus von DXR wohl über die Double-Precision Leistung korreliert bzw. implementiert ist. Solange hier die Details jedoch unbekannt sind ist eine Spekulation von dir wie oben sehr gewagt und gegenüber AMD auch im "Wortlaut" sehr negativ.

https://www.researchgate.net/publication/263784958_GPU-accelerated_ray_tracing_for_optical_simulation_and_design
http://www.idi.ntnu.no/~elster/pubs/eurographics-ludvigsen-elster.pdf
http://www.breault.com/multimedia-gallery/double-precision-ray-tracing-asap-demo-movie

Es gibt aber schon längere Zeit Ansätze hier die HALF-Precision Einheiten einzusetzen. Die Aufgrund der besseren Verüfgbarkeit im Endeffekt auch 70-80% der Leistung von DP erreichen.
https://dspace.cc.tut.fi/dpub/bitstream/handle/123456789/23212/Koskela.pdf?sequence=1

Karte DP=FP64 HP=FP16 | Tensor =FP16 (nicht !=RT-Leistung !!) im erweiterten Sinn zusätzliche FP16 Leistung.
Titan V |6.1TFlops | 24.5 TFlops | 110.5 TFlops
RTX 2080 |0.28 TFlops | 17.8 TFlops | 71.3TFlops
Radeon VII | 3.5 TFlops | 27.6 TFlops
Vega 64 | 0.79 TFlops | 25.3 TFLops

Quellen für Flopsleistungen:
https://en.wikipedia.org/wiki/List_of_Nvidia_graphics_processing_units
https://en.wikipedia.org/wiki/List_of_AMD_graphics_processing_units

EDIT:
Titan RTX |0.39 TFlops | 24.9 TFlops | 99.5 TFlops
demnach hätte die RTX sogar deutlich weniger DP als die Titan V...allerdings eben 40% mehr "Tensor" Leistung was gut zum Performance Bild in RT-passt.
Allerdings würde demnach die DXR-Software variante @Titan V irgendwie über die Tensor Cores laufen, wenn auch nicht explizit in der Form wie in den RT-Cores.
Wahrscheinlicher jedoch ist das Titan V hier den "Umweg" über die DP-Leistung geht (denn dass die Titan V den Weg über die Tensor-Leistung geht erscheint aufgrund im direkten Vergleich niedrigeren Tensor-Leistungen bei den RTX Karten nicht sinnvoll)....die Tensor-Leistung demnach gar nicht relevant für den Vergleich ist.
Man könnte demnach mal in etwa umrechnen Die Titan RTX ist ja ca 30% schnelmit Tensor-RT als die Titan V mit DP-RT:
=> 99.5TFlops "Tensor-RT" = 100% RT Leistung
=> 6.1 TFlops DP = ~ 85% RT Leistung => 1% RT-Leistung über DP sind ca. 0.07 TFlops/% RT.
https://www.3dcenter.org/news/raytracing-battlefield-v-laeuft-mit-guten-frameraten-auch-auf-der-titan-v

Demnach hätte ein 1080 Ti ca 4-5% der RT-Leistung der Titan RTX.
Entsprechend Vega ca 10-11% und Radeon VII ca 49%
End of EDIT.



Je nachdem also was genau für RT über DXR-im Software Modus gebraucht/benutzt wird (HP oder DP) steht AMD ggf. gar nicht so schlecht dar. Wenn das über HP läuft sollten Vega und VII Karten sogar die RT-Leistung einer Titan V erreichen.
Wenn das über DP läuft (was ich aktuell annehme da die meisten Fallbeispiele dafür zu finden sind). Dann hätte eine VII immerhin 50% der Leistung einer Titan V...was zwar nicht reicht um RT in Games zu bringen (das wäre dann immernoch weniger als RTX2070 an RT Leistung
hätte).
Deswegen würde ich solange hier nichts näheres bekannt ist zu dem Software-Fallback mich mit derartig spekulative Aussagen zu vermeintlichen Gründen eher zurückhalten !

Gibt es denn andere Titan Karten die den Software-Fallback auch können oder nur die Titan V ?

Wenn es nur die V ist dann ist das für mich ein Zeichen dass man vor allem DP braucht.
Denn Titan X /Xp bzw 1080 Ti haben jeweils nur ~0.3 TF in DP !
Hätten aber immerhin ~11 TF in HP !

Der Hauptunterschied zwischen Titan V und 1080 Ti / Titan X (oder Xp) ist im wesentlichen die ca 20x-30x fach höhere DP Leistung.


WENN also DP für Software-DXR benutzt wird dann wäre eine Radeon VII immerhin bei ca 50% der Titan V bei RT-Software Leistungsmäßig zu verorten !

Die MI50/MI60 mit ihren massiven DP-Raten ~7TFlops müssten eigentlich sogar besser als die Titan V dann gehen !

Schau dir doch bitte nochmal an wieviele deiner Schlussfolgerungen und Darstellungen auf hätte/wenn/angenommen etc. basieren um zu diesem Ergebniss zu kommen.....

Gast
2019-03-01, 18:59:59
Die RT-Cores könnten tatsächlich "nichts weiter" als einen auf eigene HW optimierten Softwarestack für quantisiert komprimierte 8bit weite Intersection Berechnungen in Nvidias BVH darstellen.

Das würde erklären, warum Turing beim Raytracing so ineffizient ist (nur etwa 2x effizienter als Pascal und 100x ineffizienter als PowerVR GR6500).

Iscaran
2019-03-01, 19:01:27
"TensorRT
TensorRT is a high-performance deep learning inference engine for production deployment of deep learning applications that automatically optimizes trained neural networks for run-time performance. TensorRT v1 has support for FP16 for inference convolutions, and v2 will support INT8 for inference convolutions."

Die RT-Cores könnten tatsächlich "nichts weiter" als einen auf eigene HW optimierten Softwarestack für quantisiert komprimierte 8bit weite Intersection Berechnungen in Nvidias BVH darstellen.

Soll mir mal jemand die ominösen Tensor und RT Cores im Die-Shot zeigen. Ach ja, da war ja was. Für die 72 RT Cores braucht es je 8 Tensor Cores.


Interessanter Punkt !

Deswegen sehe ich das ähnlich und meiner Meinung nach sollte Leo daher mit so Spekulation wie diesen hier vorsichtig sein oder diese unterlassen (noch dazu mit diesem "Performance" Seitenhieb auf AMD):


@Gast: Ja ich habe viele Wenn und Spekulationen da drin - aber nicht WENIGER Spekulation steckt in Leonidas Aussage/Satz über den vermeintlichen Grund warum AMD angeblich/vermeintlich kein RT-Software bringt.

Insofern ist es eher eine taktische Entscheidung AMDs, dies derzeit nicht zu tun – wahrscheinlich schlicht aus Performance-Gründen. Letztlich hat nVidia selbigen Fallbackmodus außerhalb seiner RayTracing-Beschleuniger nur bei der Titan V aktiviert, welche zum die Entwicklungs-Plattform für RayTracing war und zum anderen durch ihre pure Power immer noch eine passable RayTracing-Performance erreicht.


Lass diese unfundierten Spekulationen lieber:


Fakt ist aktuell nur dass so ziemlich keiner einigermaßen sicher weiß was für ein "Voodoo" hier mit den RT-Cores betrieben wird und was wiederum DXR-RT-Software Fallback (anstelle der RT-Cores) Performance mäßig relativ hierzu kostet.

Gast
2019-03-04, 14:05:38
Das würde erklären, warum Turing beim Raytracing so ineffizient ist (nur etwa 2x effizienter als Pascal und 100x ineffizienter als PowerVR GR6500).
???
Turing ist ~10x effizienter als Pascal im Raytracing