Archiv verlassen und diese Seite im Standarddesign anzeigen : Diskussion zu: Hardware- und Nachrichten-Links des 18. April 2019
Leonidas
2019-04-19, 08:16:05
Link zur News:
https://www.3dcenter.org/news/hardware-und-nachrichten-links-des-18-april-2019
EPIC tut für seine UnrealEngine4 aktuell sehr viel für die breiter anwendbare Parallelisierung,
und Unity auch.
Vor allem die deutlich einfachere Zugänglichkeit von Kreativen ohne tiefe Engine-Verständnis wird immerweiter erhöht.
Auch die bessere Achtsamkeit mit den Hardware-Prefetch "Daten-Layouts" wird immermehr in die Automatik der engine-eigenen Editoren und Compiler verfrachtet um die teil gigantischen Hürden für Spiel-Ersteller abzumildern.
Lest euch mal in das hier etwas ein bei Interesse:
https://www.unrealengine.com/en-US/feed
https://trello.com/b/TTAVI7Ny/ue4-roadmap
https://www.youtube.com/user/UnrealDevelopmentKit/videos
https://blogs.unity3d.com/
https://unity3d.com/unity/roadmap
https://www.youtube.com/user/Unity3D/videos
Affinator
2019-04-19, 10:35:35
Hier fehlt eindeutig die Quelle: https://de.wikipedia.org/wiki/Amdahlsches_Gesetz
Das lernt man im Informatikstudium gleich im ersten Semester...
Iscaran
2019-04-19, 11:46:12
Der Vergleich mit den 4 Tasks ist zwar schön um das Problem zu zeigen und zu verdeutlichen - hinkt halt aber leider etwas.
Deine eine Spiele Engine besteht zu jeder Sekunde aus ca ein paar Tausend Tasks die parallel ablaufen...
Die Frage ist halt in wieviele "Kategorien" sortieren die Programmierer diese Tasks um sie dann Sinnvoll "parallel/sequentiell" abarbeiten zu lassen.
Das wird halt viel zu wenig gemacht. Sich hier ggf. Gedanken über die Sortierung zu machen.
Da wird nurmal "grob" gerastert z.B. in Sound => Taskliste 1, Grafik => Liste 2, KI => Liste 3.
Dann kloppt man drüber Liste 1 = CPU-Thread 1 usw....
Und wundert sich, das dann so etwas rauskommt wie beim Burger King.
Deine eine Spiele Engine besteht zu jeder Sekunde aus ca ein paar Tausend Tasks die parallel ablaufen...
Das ist irrelevant.
Entscheidend ist wie lange der längste nicht unterteilbare Task dauert.
Ob du den Rest dann in 10, 100 oder 1000 Tasks zerlegst hat auf die Gesamtausführungszeit unwesentlich bis gar keinen Einfluss.
Bei Unity wurde dafür das C# Job System entwickelt.
https://www.youtube.com/watch?&v=-jZdMFPACpU&t=67m
https://www.youtube.com/watch?v=AXUvnk7Jws4
https://docs.unity3d.com/Manual/JobSystem.html
Leonidas
2019-04-20, 05:14:45
Hier fehlt eindeutig die Quelle: https://de.wikipedia.org/wiki/Amdahlsches_Gesetz
Das lernt man im Informatikstudium gleich im ersten Semester...
Die beschriebene Situation hat mit diesem Gesetz nix zu tun, deswegen habe ich es auch nicht erwähnt. Das Gesetz dreht sich um grundsätzlich nicht parallelisierbare Teile einer Gesamtaufgabe, sprich I/O etc. Die Relevanz dieses Gesetzes nimmt ab mit der der Höhe der Gesamtaufgabe, wo I/O immer mehr in den Hintergrund tritt. Die beschriebene Situation dreht sich eher allerdings eher darum, das einzelne CPU-Aufgaben unterschiedlich viel Rechenleistung verlangen und daher nicht perfekt parallelisiert werden können. Ist deutlich abweichend vom Ansatz dieses Gesetzes.
Mortalvision
2019-04-20, 05:40:08
Auch wenn der Amdahl Speicherallokation meint, kommt das Gesetz dem schon sehr nahe, da es von einem nicht parallelisierbaren, streng seriell abzuarbeitendem Hauptanteil ausgeht. Andererseits kann es auch superlineare Effekte der Beschleunigung geben, z.B. durch mehr Cache oder andere skalierende Teile...
Meiner Meinung nach schlicht Nvidia RT-Cores propaganda Benchmarks.
Um zu zeigen was die RT-Cores wirklich bringen bräuchte man ein "off" schalte für die RT-Cores sodass zb eine rtx2080 auch die Shader verwenden müsste. Dann würde man erst sehen wie viel die RT-Cores wirklich bringen.
Eine gtx1660ti dürfte schon, zb in BF V, so schnell sein wie eine gtx1080 und das trotz deutlich weniger Shader, weniger Bandbreite, weniger ...
Um zu zeigen was die RT-Cores wirklich bringen bräuchte man ein "off" schalte für die RT-Cores sodass zb eine rtx2080 auch die Shader verwenden müsste. Dann würde man erst sehen wie viel die RT-Cores wirklich bringen.
Das hat Nvidia am Beispiel von Metro auch gezeigt.
Eine gtx1660ti dürfte schon, zb in BF V, so schnell sein wie eine gtx1080 und das trotz deutlich weniger Shader, weniger Bandbreite, weniger ...
Soviel weniger Shader hat die 1660 gar nicht, die hat nämlich nicht nur FP32, sondern auch INT32 und FP16 Shader, und im Gegensatz zu Pascal kann sie 2 der 3 Gruppen auch gleichzeitig verwenden.
Beim Raytracing läuft einiges über INT32, und auch ein wenig FP16.
vBulletin®, Copyright ©2000-2025, Jelsoft Enterprises Ltd.