PowerVR - GPU IP [Archiv] - Seite 7

Ailuros

2020-11-13, 20:19:26

600 TOPs fuer <24W wenn's natuerlich stimmt.

mboeller

2020-11-15, 14:10:22

600 TOPs fuer <24W wenn's natuerlich stimmt.

laut IMG Webseite stimmen die <24w, die Produktseiten für die 5 Versionen sind da konsistent.

Es sind übrigens 600 TOPS in 8bit

MACs per clock rate:

8-bit: 4096 MACs/clk
16-bit: 1024 MACS/clk

4096MAC/cycle x 1,5GHz = 6144000 MAC = 12,288 TOPs / 8bit

Ailuros

2020-11-19, 05:27:11

600 TOPs (INT8) / 300 TFLOPs (FP16) sind etwas weniger als das was A100 momentan liefert; wird aber wohl keiner so viel benutzen ausser sie haetten einen Kunden der z.B. einen high end automotive SoC entwickelt. Ihre Kunden dort (TI, Renesas u.a.) entwickeln hauptsaechlich mainstream SoCs.

Ailuros

2021-01-12, 05:43:14

Ein klein bisschen besser geht es ihnen wohl schon....

https://www.imaginationtech.com/news/press-release/imagination-update-on-2020-progress/

Imagination has a 35.5% share in smartphone graphics processing unit (GPU) (source: TSR) and is the largest GPU supplier to the automotive industry with approx. 43% share (source: company data). 2019 investment in Imagination’s A-Series and B-Series GPU products, which have the highest performance density of any GPU IP, has enabled the company to gain significant traction in the higher performance GPU space with six customers now targeting laptop, desktop, or datacentre.

Na endlich.....

Loeschzwerg

2021-01-12, 08:13:08

Laptop und Desktop... das hört sich schon mal nicht uninteressant an. Ich gehe hier vom asiatischen Markt aus.

mboeller

2021-04-29, 13:24:39

StarFive hat eine IMG B-Series GPU lizensiert:

https://www.imaginationtech.com/news/press-release/imaginations-gpu-selected-by-starfive-to-create-high-performance-small-and-low-cost-beaglev-risc-v-ai-single-board-computer/

Imagination Technologies announces that StarFive, an industry-leading provider of RISC-V processors, platforms and solutions, has licensed the IMG B-Series graphics processing unit (GPU) IP to support the development of its latest RISC-V single-board computer (SBC). Imagination’s GPUs are designed to work with all processor architectures. The collaboration will help grow the RISC-V ecosystem.

Ailuros

2021-08-25, 13:24:14

https://www.imaginationtech.com/news/press-release/imagination-update-on-2021-progress/

Alborix C Q4 21' und sie steigen wieder in den CPU IP Markt ein diesmal mit RISC-V open ISA. Das zweite ist wohl eine weitere Indizie dass NV wohl doch den ARM Kauf finalisieren wird; dass sich dann so manche Firma die Gelegenheit ausnutzen will ist keine Ueberraschung, ueberhaupt da IMG so oder so hauptsaechich den chinesischen Markt im Visier hat.

mboeller

2021-08-25, 13:35:16

ich fand das hier wichtiger:

Adjusted EBITDA* increased by $20m to $17m (2020: -$3m); and adjusted EBITDA margin increased to 22% (H1/2020: -7%). Current cash is $70m (H1/2020 $36m); the business has no external third-party debt.

sie machen also wieder Gewinn und haben keine Schulden bei externen Firmen/Banken (lese ich zumindest so)

Ailuros

2021-08-25, 13:55:43

ich fand das hier wichtiger:

sie machen also wieder Gewinn und haben keine Schulden bei externen Firmen/Banken (lese ich zumindest so)

Ja. Trotzdem ist ihr halbjaehriger Umsatz von 76Mio immer noch Erbsen selbst fuer eine IP Schmiede.

mboeller

2021-11-04, 20:00:52

die haben sich einen komischen Tag ausgesucht:

IMG CXT:

Imagination launches the most advanced ray tracing GPU (https://www.imaginationtech.com/news/press-release/imagination-launches-the-most-advanced-ray-tracing-gpu/)

The IMG CXT-48-1536 RT3 core features three instances of the Ray Acceleration Cluster (RAC), offering up to a total of 1.3GRay/s. This delivers photorealistic ray traced shadows, reflections, global illumination, and ambient occlusion, with high frame rates, in a mobile power budget.

The Photon architecture can be scaled to cloud, data centre and PC markets thanks to Imagination’s multi-core technology. This can generate up to 9TFLOPS of FP32 rasterised performance and over 7.8GRay/s of ray tracing performance, all while offering up to 2.5x greater power efficiency than today’s Level 2 or 3 RTLS ray tracing solutions.

7.8GRays/s ... wie kann man das mit Nvidia und AMD vergleichen?

der letzte Punkt in der Auflistung ist der wichtigste:

Already licensed for multiple markets

davidzo

2021-11-04, 20:56:21

7.8GRays/s ... wie kann man das mit Nvidia und AMD vergleichen?

der letzte Punkt in der Auflistung ist der wichtigste:

xbox series X / AMD RDNA2:

Bis zu 380 Gigarays pro Sekunde sollen es sein (52 CUs * 4 RT * 1,825 GHz). Nvidia gibt für die RTX 2080 Ti beispielsweise 10 Gigarays pro Sekunde an. Die Werte setzen sich allerdings anders zusammen und sind ohne praktische Tests demnach nicht vergleichbar.

Laut Computerbase werden die Raytracing-Funktionen in die Textureinheiten implementiert, wodurch pro CU und Taktzyklus entweder vier Textur- oder vier Raytracing-Operationen ausgeführt werden können. Allerdings gibt Microsoft auch noch 95 Gigarays pro Sekunde pro Ray-Triangle (RT-Kern) an, was darauf hindeuten könnte, dass die GPU die Aufgaben je nach Last verteilen kann - also beispielsweise auch zwei Textur- und zwei Raytracing-Operationen pro CU und Takt.

https://www.gamestar.de/artikel/amd-radeon-rx-big-navi-technische-details-xbox-series-x-pc,3360989.html

Ailuros

2021-11-05, 14:34:38

die haben sich einen komischen Tag ausgesucht:

IMG CXT:

Imagination launches the most advanced ray tracing GPU (https://www.imaginationtech.com/news/press-release/imagination-launches-the-most-advanced-ray-tracing-gpu/)

7.8GRays/s ... wie kann man das mit Nvidia und AMD vergleichen?

der letzte Punkt in der Auflistung ist der wichtigste:

Ist doch praktisch wurscht wie es sich zu anderen Loesungen vergleicht, wenn es erstmal einen bzw. 2 hw level hoeher liegt als die anderen zwei und noch wichtiger da die cores hauptsaechlich fuer ULP mobile SoCs gedacht sind. Bis die CTX basierende IP in fertiger hw von Partnern erscheint hat die Konkurrenz dann wohl wieder aufgeholt. IMG gibt uebrigens an, dass sie mit dem RT block fuer vergleichbare Leistung mit ihren USCs um 44x Mal so viel Flaeche brauchen wuerden.

Bleibt abzuwarten was der kommende Exynos mit AMD GPU IP auf den Tisch bringt, aber etwas besonderes wuerde ich nicht erwarten. Falls Apple lizenziert hat, weiss der Geier was sie mit einer Architetur-Lizenz in einen SoC stopfen koennen wenn ich mir den M1 Max nochmal ueberdenke. Bleibt aber vorruebergehend dabei dass Apple es nicht besonders mit gaming am Hut hat.

Loeschzwerg

2021-11-05, 17:26:05

Ganz allgemein vermisse ich deren neuere IP in irgendwelchen Produkten (oder wir wissen nix davon). Gibt es irgendetwas kaufbares mit Series A/B, NNA oder Risc-V in Form von Tablets, Smartphones, SBCs?

Ailuros

2021-11-06, 14:37:52

Ganz allgemein vermisse ich deren neuere IP in irgendwelchen Produkten (oder wir wissen nix davon). Gibt es irgendetwas kaufbares mit Series A/B, NNA oder Risc-V in Form von Tablets, Smartphones, SBCs?

Ich bezweifle dass es etwas kaufbares gibt. In ein paar verstreuten Mediatek SoC stecken Series9/Rogue Varianten drin und danach die Sintflut. Streng auf IP konzentriert hat IMG im automotive den groessten Marktanteil aber der Markt bewegt sich im Schneckentempo und hat auch sehr geringen Gewinn.

Fuer alles Risc-V dass sie entwickeln ist es noch viel zu frueh da es noch nicht mal einen fertigen design davon gibt.

mboeller

2021-11-06, 15:35:26

bei IMG ist es wirklich schwer ihre Produkte zu finden.

auf ihrer Webseite findet man auch nur einige sehr ungenaue Angaben

In the first half Imagination signed over 35 licensees across segments including automotive, datacentre and desktop, mobile, and DTV

Es dauert bestimmt noch bis man davon als Konsument was sieht.

https://www.imaginationtech.com/news/press-release/imagination-update-on-2021-progress/

Das Video von IMG, dass das CXT Raytracing zeigt fand ich ganz gut. Das Video war nicht so "over the top" mit den ganzen Effekten wie das normalerweise bei solchen "show off" Videos der Fall ist

https://www.youtube.com/watch?v=QxNLzg6gg7s

Loeschzwerg

2021-11-17, 21:42:28

https://videocardz.com/newz/innosilicons-fenghua-no-1-graphics-card-supports-pci-e-4-0-hdmi-2-1-gddr6x-and-directx

Basiert vielleicht wie "Fantasy" von Innosilicon auf IMG B-Series Architektur bzw. ist ein neuer Name oder vielleicht ein Name aus der Serie. In jedem Fall spannend.

Edit:
In der originale Meldung von Tom'sHardware wird etwas von "The Fenghua No. 1 seems to be a multi-chiplet GPU" geschrieben, was ja ebenfalls zur IMG B-Series passen würde.
https://www.tomshardware.com/news/chinese-xindong-fenghua-gpu-announced

y33H@

2021-11-18, 13:31:22

ImgTech hat's mir gerade bestätigt, ist PowerVR IP - aber keine Details vorerst.

Loeschzwerg

2021-11-18, 13:35:23

Danke :up:

Ailuros

2021-11-18, 15:39:35

GPU IP fuer Maerkte ausserhalb von ULP mobile SoCs ist die einzige Hoffnung dass IMG langfristig ueberleben kann. IP im mobilen Markt ist so gut wie tot, und die Chinesen schreien regelrecht nach billigeren Loesungen im Vergleich zu AMD/NV. Bleibt abzusehen was weiterhin daraus werden kann, denn wo immer anspruchsvolle software Unterstuetzung mitkommt kann IMG nicht fuer ihr Leben mit AMD/NV heutzutage konkurrieren.

Mit einem 4-core CXT Gespann erreichen sie nach eigenen Angaben bis zu 7.8GRays/s und 9 TFLOPs FP32 fuer eine hypothetische cloud/server/desktop GPU Loesung. Was wir hier brauchen sind Verbrauchswerte von solchen Loesungen wenn sie auf den Markt kommen und deren Verkaufspreis. Verbraucht jetzt so ein Tier sehensert weniger und ist auch ein gutes Stueck billiger, kann sehr wohl etwas daraus werden. In jeglichem anderen Fall = *schnarch*

konkretor

2021-11-18, 17:14:36

https://www.golem.de/news/fenghua-no-1-gpu-innosilicon-bringt-chinesische-powervr-grafikkarte-2111-161164.html

Text von der Webseite übersetz, achtung zertifikats fehler beim aufrufen....

https://innosilicon.com.cn/news/117.html

Recently, CoreTech has announced that its high-performance graphics GPU chip - "Feng Hua 1", which is customized for China's 5G data center, has been successfully tested and is about to make its global debut. "Equipped with the world's top GDDR6X and chiplet technology, Fenghua No.1 achieves a zero breakthrough in domestic high-performance graphics GPU for data centers, significantly improving the graphics rendering capability of domestic GPUs and enabling new infrastructure, which will make a big difference in 5G data centers, metaverse, cloud desktops, cloud games, cloud cell phones, Cintron desktops, workstations and other applications. It will shine in application areas such as 5G data center, metaverse, cloud desktop, cloud game, cloud mobile phone, Cintron desktop and workstation.

As the carrier platform for intelligent computing and graphics rendering, GPU-related industries have become a hundred billion track. However, due to the high hardware and software technology and application threshold, this track has long been monopolized by foreign giants, especially in the field of graphics cards for workstations and data centers, domestic graphics GPU performance lags behind and does nothing, becoming a "neck" field. In recent years, this field and a number of high-profile startups have entered and received billions of huge venture capital and attention. But after all the noise, there is still no mass-produced product on the market that can match the international giants, so it is no wonder that the public jokes: "domestic independent GPU, the valuation of all rely on PPT".

It is reported that the "Feng Hua 1" GPU is the industry's first rendering GPU using the world's top GDDR6X high-bandwidth memory technology and Innolink chiplet and other cutting-edge technologies, China's patented physical unclonable encryption PUF technology, PCIe 4.0, HDMI2.1, DP/eDP 1.4 and other self-developed advanced technologies, also converge on a core. "Fenghua No.1 is the first one in China to adapt to 4K HD desktop and high-performance server GPU at the same time, supporting domestic Linux, Android and Windows operating systems; supporting OpenGL/OpenGLES/OpenCL/Vulkan/DX and other mainstream graphics frameworks; supporting VR/AR/AI; smoothly supporting /AR/AI; smoothly supports multi-way cloud gaming, cloud cell phone, cloud office, cloud desktop and other data center level multi-user application scenarios. The success of "Feng Hua 1" is a demonstration of CoreTech's strong strength in advanced process IP and GPU custom development and its low-key style of doing more than talking.

Over the past 15 years, as a one-stop IP and custom chip leader in China, CoreTech has been working quietly and continuously investing heavily in advanced semiconductor process core technology research and development, and has achieved many core technology achievements to fill the gaps in China through record-breaking flow polishing, empowering many world-renowned enterprises with more than 5 billion high-end SoC chips and changing the history of domestic advanced process high-end IP being restricted by others. Now, with years of technology accumulation, Core Dynamic Technology has made a major breakthrough in the field of domestic data center GPU, significantly improving the existing level and changing the situation of server-level high-performance GPU without a domestic core. The birth of "Fenghua 1" is the beginning of the continuous iteration of many Fenghua series GPUs, enabling new infrastructure, which will strongly help the domestic replacement of high-performance GPUs. Whether it is office or playing games, I believe we will soon be able to use the smooth graphics experience good domestic GPU.

Translated with www.DeepL.com/Translator (free version)

Loeschzwerg

2021-11-30, 06:18:13

https://www.forum-3dcenter.org/vbulletin/attachment.php?attachmentid=77519&stc=1&d=1638249177

https://videocardz.com/newz/innosilicon-graphics-cards-based-on-fantasy-one-gpu-feature-up-to-32gb-gddr6x-memory

Originale News Quellen (CN):
https://news.mydrivers.com/1/799/799377.htm
https://www.ithome.com/0/589/440.htm

Chiplet GPU Design und sogar eine Dual GPU Karte... mit VGA, das hat schon was :D

Edit: Zugegeben, mit der Dual GPU Karte musste ich kurzzeitig doch an XGI denken ^^ Da bin ich echt gespannt ob man die Leistung auf die Straße bekommt. Treiber sind natürlich ein riesiges Fragezeichen.

davidzo

2021-11-30, 13:24:37

Lol, die Karten sehen echt strange aus.
Schon lange keinen VGA-port mehr gesehen! Auch die anderen Karten sind mit 1x HMDI und 1x Displayport eher dürftig ausgestattet.

Die Karte mit dem Heatpipekühler wirkt so als wenn man die Lüfter und Fanshroud vergessen hat, wird aber auch im Rendering auf den Folien genau so gezeigt.
Ist wahrscheinlich die "Mining-Edition" - für externer Belüftung, daher auch die singleslot Blende.

Btw, die I/o Blende ist gerade so aus dem lasercutter gedroppt, da ist sogar noch der Grat von der Einstichstelle dran.
Die Kühllösungen und Formfaktoren sehen auch so aus als wenn sie gerade noch mehrere OEMs durchprobieren. So ein Strangprofil mit eingepressten heatpipes ist eher was für eine 120-150Watt Karte, egal ob da zwei oder drei Lüfter drauf sind.

Von der Rohleistung ist die Karte irgendwo zwischen Navi23 und Navi24. Falls die bei der Rohleistung vom TBDR Bonus profitieren können, könnte die Karte auf 6600XT niveau landen. Aber da muss man schon ganz doll die Daumen drücken. RDNA2 ist ja auch bereits sehr effizient, das muss man erstmal erreichen. Im worstcase erreich man nichtmal navi24, der vergleichbare Rohleistung bietet.
Taktraten scheinen aber noch niedriger zu sein als IMGtec veranschlagt hat. Was mich auch wundert ist die hohe Bandbeite. GDDR6X wirkt Overkill für nur 5Tflops und Imgtec Designs waren doch seit jeher sehr Bandbreitenschonend.

Ich schätz mal die 5nm Pläne sind der aktuelle Pitch für Investoren. Ich kann mir kaum vorstellen dass die schon 5nm tapeouts vorfinanziert haben. Aber mit Innocilicons Historie im Mining und genug reichen Chinesen die auf suche nach lukrativen Investments sind, könnte das wirklich klappen das zu finanzieren.
Spannend!

robbitop

2021-12-01, 12:56:53

Ein Großteil des TBDR Bonus existiert in modernen Engines IMO schon lange nicht mehr. Seit ~10 Jahren sind die meisten Engines Deferred Rendering. Entsprechend wird sämtlicher Overdraw von Haus aus eh schon gecullt.
Der verbleibende Vorteil ist die Bandbreite durch den Tilecache in dem gearbeitet werden kann bis der jeweilige Tile komplett fertig 1x in den Framebuffer geschoben werden kann.

AMD's Infinity cache ist zwar nicht das gleiche, hat aber einen ähnlichen Effekt (auch wenn man viel mehr Cache dafür braucht). Entsprechend erwarte ich nur aus dem Fakt heraus, dass es ein TBDR ist ggü RDNA2 keine wirklichen Vorteile mehr.

Dann geht darum, wie viel kann man aus den bestehenden FLOPs rausholen pro SM/CU/EU. Wie gut ist die Kontrolllogik, wie fein die Granularität, wie groß ist der Flaschenhals mit den Registern, wie gut funktioniert der Shadercompiler, wie gut ist die Spielespezifische Optimierung usw.

Die Frage ist, wie viel Fokus bei diesen GPUs auf 3D Gaming liegt und wie viel auf anderen Anwendungen. Das hat schnell Einfluss auf die Performance bei 3D Grafik. Ich erwarte da ehrlich gesagt nicht zu viel.

Auch das MultiGPU Konzept sehe ich in Bezug auf 3D Grafik sehr skeptisch. In Bezug auf HPC/Mining etc ggf. eher nicht.

Weiß man, ob diese GPUs auch für den 0815 Endkunden erhältlich sein werden?

Irgendwie spannend und auch kurios, dass es seit fast 2 Jahrzehnten mal wieder eine dGPU mit IMG IP gibt. Genau wie mit Intel. 2021/22 friert die Hölle zu. :D

Loeschzwerg

2021-12-01, 13:02:22

Für Typ A erwarte ich eine allgemeine Verfügbarkeit (zumindest in Asien), sonst hätte man sich den Spaß auch sparen können. Möglich ist natürlich eine ausschließliche Bundle Option über OEM (ala DG1 jüngst).

Ailuros

2021-12-01, 14:46:34

Lol, die Karten sehen echt strange aus.
Schon lange keinen VGA-port mehr gesehen! Auch die anderen Karten sind mit 1x HMDI und 1x Displayport eher dürftig ausgestattet.

Die Karte mit dem Heatpipekühler wirkt so als wenn man die Lüfter und Fanshroud vergessen hat, wird aber auch im Rendering auf den Folien genau so gezeigt.
Ist wahrscheinlich die "Mining-Edition" - für externer Belüftung, daher auch die singleslot Blende.

Btw, die I/o Blende ist gerade so aus dem lasercutter gedroppt, da ist sogar noch der Grat von der Einstichstelle dran.
Die Kühllösungen und Formfaktoren sehen auch so aus als wenn sie gerade noch mehrere OEMs durchprobieren. So ein Strangprofil mit eingepressten heatpipes ist eher was für eine 120-150Watt Karte, egal ob da zwei oder drei Lüfter drauf sind.

Zielmarkt ist China und das Resultat sollte um einiges billiger sein als das was die Konkurrenz bietet fuer N Markt.

Von der Rohleistung ist die Karte irgendwo zwischen Navi23 und Navi24. Falls die bei der Rohleistung vom TBDR Bonus profitieren können, könnte die Karte auf 6600XT niveau landen. Aber da muss man schon ganz doll die Daumen drücken. RDNA2 ist ja auch bereits sehr effizient, das muss man erstmal erreichen. Im worstcase erreich man nichtmal navi24, der vergleichbare Rohleistung bietet.

Wenn man synthetische benchmarks weglaesst liegt die Rohlleistung eines M1 Max wo genau in Spielen? Ohne dementsprechende Treiber-Optimierungen muss man leider die Erwartungen extrem niedrig halten.

Was mich auch wundert ist die hohe Bandbeite. GDDR6X wirkt Overkill für nur 5Tflops und Imgtec Designs waren doch seit jeher sehr Bandbreitenschonend.

Ich dachte die Tiere haben einen 128bit bus?

Ich schätz mal die 5nm Pläne sind der aktuelle Pitch für Investoren. Ich kann mir kaum vorstellen dass die schon 5nm tapeouts vorfinanziert haben. Aber mit Innocilicons Historie im Mining und genug reichen Chinesen die auf suche nach lukrativen Investments sind, könnte das wirklich klappen das zu finanzieren.
Spannend!

China will einfach etwas haben um unabhaengiger von NV und AMD zu sein. Eher eine billigere Alternative wobei man in Felden wo es intensive Treiber-Unterstuetzung braucht das Zeug wohl leicht vergessen kann.

Ailuros

2021-12-01, 15:03:19

Ein Großteil des TBDR Bonus existiert in modernen Engines IMO schon lange nicht mehr. Seit ~10 Jahren sind die meisten Engines Deferred Rendering. Entsprechend wird sämtlicher Overdraw von Haus aus eh schon gecullt.
Der verbleibende Vorteil ist die Bandbreite durch den Tilecache in dem gearbeitet werden kann bis der jeweilige Tile komplett fertig 1x in den Framebuffer geschoben werden kann.

TBDR hat genauso wie IMR Vor- und Nachteile. Genau deshalb tilen IMRs auch zunehmend mehr mit der Zeit, bleiben aber doch am Ende eigentlich immediate mode renderers. Ich sagte schon in den 90-er Jahren dass das hypothetische Optimum irgendwo zwischen den beiden "Welten" liegt.

AMD's Infinity cache ist zwar nicht das gleiche, hat aber einen ähnlichen Effekt (auch wenn man viel mehr Cache dafür braucht). Entsprechend erwarte ich nur aus dem Fakt heraus, dass es ein TBDR ist ggü RDNA2 keine wirklichen Vorteile mehr.

Wird aber langsam schnuppe denn fuer eine Ewigkeit werden heutige Architekturen auch nicht mehr existieren. Geht es in weiterer Zukunft irgendwann mal in Richtung compute shader Architekturen, dann ist das einzige nutzvolle einer heutigen CTX/Albiorix GPU ihr G-buffer und seine RACs fuer RT.

Dann geht darum, wie viel kann man aus den bestehenden FLOPs rausholen pro SM/CU/EU. Wie gut ist die Kontrolllogik, wie fein die Granularität, wie groß ist der Flaschenhals mit den Registern, wie gut funktioniert der Shadercompiler, wie gut ist die Spielespezifische Optimierung usw.

Die Frage ist, wie viel Fokus bei diesen GPUs auf 3D Gaming liegt und wie viel auf anderen Anwendungen. Das hat schnell Einfluss auf die Performance bei 3D Grafik. Ich erwarte da ehrlich gesagt nicht zu viel.

Voll zustimm.

Auch das MultiGPU Konzept sehe ich in Bezug auf 3D Grafik sehr skeptisch. In Bezug auf HPC/Mining etc ggf. eher nicht.

IMG hat nie bis jetzt irgendwelches AFR noch irgendwelche andere software basierende mGPU Loesung benutzt und werden auch jetzt nicht damit anfangen. Furzt der Treiber in falsche Richtung hasst Du erstmal miserable pro core Leistung und diese wird dann auch wie erwartet mit der Anzahl der cores sklalieren; nur ist es eben ziemlich scheissegal wenn man so oder so beschissene Leistung dank fehlender Treiber-Optimierungen hat.

Weiß man, ob diese GPUs auch für den 0815 Endkunden erhältlich sein werden?

Uhmmm erhlich gesagt hoffentlich nicht. Ausser IMG waechst irgendwann etwas mehr und kann genug resources in sw Optimierungen schuetten.

Irgendwie spannend und auch kurios, dass es seit fast 2 Jahrzehnten mal wieder eine dGPU mit IMG IP gibt. Genau wie mit Intel. 2021/22 friert die Hölle zu. :D

Als ob es einen Unterschied macht wie sich jegliche Loesung nennt oder beschrieben wird. Apple M1 Max hat eine ziemlich massive GPU fuer einen SoC und obwohl die Endleistung in synthetischem Mist auf notebook 3080 Nivaeu liegt, kann das Tier in Spielen gerade noch einer notebook 3060 hinterher schnaufen.

https://www.anandtech.com/show/17024/apple-m1-max-performance-review/6

Leistung skaliert hier uebrigens auch wie man erwarten wuerde mit analoger Steigerung der Anzahl der cores (von 8 ueber 16 bis zu 32 "cores").

davidzo

2021-12-01, 15:13:52

Zielmarkt ist China und das Resultat sollte um einiges billiger sein als das was die Konkurrenz bietet fuer N Markt.

geprototypte Lasercuts aus V2A und fehlendes Finishing machen das Endprodukt nicht billiger. Am Ende wird das sowieso aus vernickeltem Stahl gestanzt, das ist viel günstiger und hinterlässt keine solchen Grate.

Ich dachte die Tiere haben einen 128bit bus?

128bit ist aber eine Menge für eine 50Watt Entry level GPU. Das ist 50% von Navi21, einer big fucking 1000€+ GPU.

GA107 hat auch nur 128bit 14gbps und kein G6X für 8-10Tflops an FP32-Leistung.

Navi24 hat für eine vergleichbare Rohleistung nur 64bit. Großer IFcache ist bei Navi24 auch kein Argument, das sind lediglich 16Mb.
Bei einem TBDR hätte ich eine ähnliche Bandbreiteneffizienz wie bei RDNA2 erwartet. Man hat aber sogar mehr gb/s pro Tflop als Ampere, klingt nicht besonders bandbreiteneffizient.

China will einfach etwas haben um unabhaengiger von NV und AMD zu sein. Eher eine billigere Alternative wobei man in Felden wo es intensive Treiber-Unterstuetzung braucht das Zeug wohl leicht vergessen kann.
Innosilicon sieht mir nicht wie eine Government Initiative aus wo es darum geht unabhängiger vom Westen zu werden. Dazu sind die zu schnell, es fehlen die Kooperationspartner aus den Universitäten, die Politiker im Vorstand und die Präsentation und Produkte ist zu gaming-orientiert.
Ich glaube das ist privatfinanziert, die sehen einfach die Business Opportunity, ähnlich wie damals XGI. Seitdem Mittelklasse GPUs 600-800€ kosten kann man den Investoren aber auch eine sehr überzeugende RoI Planung vorlegen. Selbst wenn die erste Serie nichts wird, reicht das als SW Development Vehikel wie bei DG1, solange das Funding für eine zweite Serie gesichert ist.

Ailuros

2021-12-01, 15:34:57

128bit ist aber eine Menge für eine 50Watt Entry level GPU. Das ist 50% von Navi21, einer big fucking 1000€+ GPU.

GA107 hat auch nur 128bit 14gbps und kein G6X für 8Tflops an FP32-Leistung.

Navi24 hat für eine vergleichbare Rohleistung nur 64bit. Großer IFcache ist bei Navi24 auch kein Argumen, das sind lediglich 16Mb.
Bei einem TBDR hätte ich eine ähnliche Bandbreiteneffizienz wie bei RDNA2 erwartet. Man hat aber sogar mehr gb/s pro Tflop als Ampere, klingt nicht besonders bandbreiteneffizient.

Weiss der Geier wieso Innosilicon so viel Bandbreite fuer diese benutzt hat. Grundlos ist die Entscheidung sicherlich nicht.

Uebrigens press-release October 2020: https://www.imaginationtech.com/news/press-release/innosilicon-selects-imaginations-new-bxt-multi-core-gpu-ip-for-cloud-computing/

Innosilicon sieht mir nicht wie eine Government Initiative aus wo es darum geht unabhängiger vom Westen zu werden. Dazu sind die zu schnell, es fehlen die Kooperationspartner aus den Universitäten, die Politiker im Vorstand und die Präsentation und Produkte ist zu gaming-orientiert.
Ich glaube das ist privatfinanziert, die sehen einfach die Business Opportunity, ähnlich wie damals XGI. Seitdem Mittelklasse GPUs 600-800€ kosten kann man den Investoren aber auch eine sehr überzeugende RoI Planung vorlegen. Selbst wenn die erste Serie nichts wird, reicht das als SW Development Vehikel wie bei DG1, solange das Funding für eine zweite Serie gesichert ist.

Uhmmm Imagination gehoert aber zu Canyon Bridge die eigentlich auch eine "private" Initiative zu sein scheint, wird aber doch vom chinesichen Staat unterstuetzt. IMG verkauft IP und Innosilicon hat diesen gekauft obwohl sie es mit einem AMD bzw. NVIDIA oder anderem chip um einiges leichter gehabt haetten. Dass China an sich plante mit dGPUs mit IMG IP aufzutreten ist wirklich nichts Neues und ich hab es hier im Forum schon seit langem mehrmals wiederholt. Auch die Tatsache dass IMG seit neuestem nach dem MIPS Verkauf wieder CPU IP durch RISC-V designs irgendwann mal wieder anbieten wird ist kein Zufall.

Imagination wollte eben NICHT dass Apple sie aufkauft und haben sich mit Absicht in Richtung China gewendet. Weil die US den Canyon Bridge Aufkauf blockiert haette wurde jegliche US relative IP/Technologie/Personal verkauft oder entbehrt und deshalb wurde MIPS sofort verkauft und die ehemalige Caustic Ray Tracing Abteilung in der US geschlossen und das gesamte Personal damals entlassen.

IMG hat seither wieder Personal zusammengekratzt und konnte somit mit den ex-Caustic Patenten ray tracing in die C-Series pipeline als RACs integrieren und entwickelt wieder CPU IP mit RISC-V.

In der Zwischenzeit da das obrige Management bei IMG zu bloed war einzusehen dass der mobile GPU IP Markt keine Zukunft mehr hat und die Initiative fuer higher end GPU IP fuer China hauptsaechlich zu langsam vor sich ging, hat IMG so manches top GPU engineering Talent an Huawei u.a. verloren.

Jetzt womoeglich wieder in die andere Richtung? IMG's obriges management war schon immer fuer die Muelltonne. https://www.eenewseurope.com/news/imagination-looks-ipo-or-sale

robbitop

2021-12-01, 16:20:48

Apple M1 Max hat eine ziemlich massive GPU fuer einen SoC und obwohl die Endleistung in synthetischem Mist auf notebook 3080 Nivaeu liegt, kann das Tier in Spielen gerade noch einer notebook 3060 hinterher schnaufen.

https://www.anandtech.com/show/17024/apple-m1-max-performance-review/6

Leistung skaliert hier uebrigens auch wie man erwarten wuerde mit analoger Steigerung der Anzahl der cores (von 8 ueber 16 bis zu 32 "cores").
Stimmt Apple's große SoCs habe ich vergessen. Aber ich fürchte, dass Apple auch wenig Spieleoptimierung im Treiber vornehmen wird. Entsprechend muss man die Resultate da auch einordnen.
Dazu kommt, dass bei den Benchmarks oft x86 emuliert werden muss und Wrapper genutzt werden. Das frisst auch Leistung. Und trotz dessen ist das Ergebnis nicht schlecht. 60 W für den ganzen SoC vs 70...130W nur für die 3060.

Die uArch ist sicherlich ziemlich gut. Wenn man wöllte (mit optimierten Treibern) könnte man NV ganz schön in Bedrängnis bringen. Aber Apple zielt eher auf Content Creators da dort mehr Geld zu verdienen ist.

mboeller

2021-12-01, 17:03:47

mal ein klein wenig neues zum CTX:

This is why we’re excited to bring the IMG CXT to market. Our CXT 48-1536 RT3 core offers 48GTexels/s, equivalent to 1.5 TFLOPS FP32 to superb rasterisation performance, closely coupled with 1.3Gray/s or performance. It can also deliver 6 TOPS of AI performance for good measure – and all within a mobile power budget of around 1-2 watts.

https://www.imaginationtech.com/blog/why-gamers-and-developers-should-care-about-ray-tracing/

TheAntitheist

2021-12-02, 08:45:59

Aber Apple zielt eher auf Content Creators da dort mehr Geld zu verdienen ist.
Content Creator bringen auf keinen Fall ansatzweise soviel Geld ein wie alle Gamer... bei weitem nicht.

Wenn CCs Apple Hardware kaufen, dann aber auch nur in bestimmten Branchen, denn wenn man Rendern will gibts nur Nvidia. Wenn du Texturieren willst mit SP/Mari, würd ich auch sagen Nvidia Only. Für alle Bereiche wo man richtig viel RAM/Vram brauch fällt Apple auch raus, da ist 64GB das limit. Das ist nix heutzutage.

robbitop

2021-12-02, 11:34:43

Damit meine ich Gewinnspanne bei der Hardware pro verkaufter Unit. Und außerhalb Corona ist die bei Macs schon höher als bei regulären PCs.

=Floi=

2021-12-02, 12:12:10

Ein Großteil des TBDR Bonus existiert in modernen Engines IMO schon lange nicht mehr.

dem stimme ich nicht zu. Du siehst ja selbst, wie gut RDNA1 und dann 2 wurde. Bei NV ging es nach pascal auch erst richtig voran.

robbitop

2021-12-02, 13:06:50

Was hat das mit einem TBDR zu tun? Alle uArchs die du nennst sind IMRs. Falls du auf den Draw Stream Binning Rasterizer anspielst - das ist schon was anderes als ein TBDR. Und Vega hatte den auch schon.

Ailuros

2021-12-02, 19:22:48

Stimmt Apple's große SoCs habe ich vergessen. Aber ich fürchte, dass Apple auch wenig Spieleoptimierung im Treiber vornehmen wird. Entsprechend muss man die Resultate da auch einordnen.
Dazu kommt, dass bei den Benchmarks oft x86 emuliert werden muss und Wrapper genutzt werden. Das frisst auch Leistung. Und trotz dessen ist das Ergebnis nicht schlecht. 60 W für den ganzen SoC vs 70...130W nur für die 3060.

Die uArch ist sicherlich ziemlich gut. Wenn man wöllte (mit optimierten Treibern) könnte man NV ganz schön in Bedrängnis bringen. Aber Apple zielt eher auf Content Creators da dort mehr Geld zu verdienen ist.

Tja die Emulation hilft hier leider nicht; so oder so geht ein gutes Stueck an GPU Leistungs-potential momentan den Bach runter.

Uebrigens bleibt Apple bei IMG Architektur-Lizenzen auch in Zukunft, ist es zum absolutesten Vorteil fuer IMG wenn auch indirekt. Apple ist wohl der einzige Hersteller der irgendwann fuer TBDR z.B. API-bedingte Optimierungen anfragen koennte. DRs verdauen massive Geometrie-mengen schlecht; im gegebenen Fall reicht eine Art "geometry tiling" im API wofuer langfristig auch die anderen IHVs wohl nichts dagegen haben werden aus verstaendlichen Gruenden.

Am Rand lese ich in letzter Zeit immer und immer wieder dass der PowerVR schlecht angelegt sein soll mit ray tracing. Stimmen Caustic's ehemalige und heutige IMG Behauptungen dafuer dann hat IMG eher einen sehr gesunden Vorteil ueberhaupt gegen QCOM und ARM GPU IP.

Sonst werkelt im M1 Apple immer noch mit einer umgekrempelten Series7 Plus Variante herum. Im Vergleich zu Albiorix A und womoeglich auch B haelt sich ihre semi-custom GPU noch ziemlich gut; ab C die nochmal 50% vor B liegen soll, die gesamte decentralized multicore Affaere (die leider wenige bis jetzt verstanden haben) und die ray tracing RACs hat IMG schon gute Chancen Apple zu einer neuen Architektur-Lizenz zu lozen. Umkrempeln koennen sie diese dann auch nach eigenem Bedarf uebere mehrere Jahre.

Ailuros

2021-12-02, 19:32:39

mal ein klein wenig neues zum CTX:

https://www.imaginationtech.com/blog/why-gamers-and-developers-should-care-about-ray-tracing/

Da nicht jeder die IMG whitepapers liest: mobile CTX Varianten werden maximal mit 1GHz momentan berechnet und die hoechste 4-core CTX Variante fuer desktop und co dann mit <1.5GHz.

robbitop

2021-12-03, 10:02:23

Die Frage ist immer wie viel von der eigentlich len uArch aus S7 immer noch in den Apple SoCs ist. Evolution ist ja normal - auch bei AMD und NV sind deren uArchs auf deren Vorgängern aufgesetzt und enthalten noch einiges. Aber von Änderung zu Änderung wird der Teil immer kleiner. Auf Transistorebene und in der konkreten Umsetzubg der Pipeline sind die Unterschiede wahrscheinlich mittlerweile schon groß. Ggf im high level und der ISA weniger.

Ailuros

2021-12-03, 10:56:05

Die Frage ist immer wie viel von der eigentlich len uArch aus S7 immer noch in den Apple SoCs ist. Evolution ist ja normal - auch bei AMD und NV sind deren uArchs auf deren Vorgängern aufgesetzt und enthalten noch einiges. Aber von Änderung zu Änderung wird der Teil immer kleiner. Auf Transistorebene und in der konkreten Umsetzubg der Pipeline sind die Unterschiede wahrscheinlich mittlerweile schon groß. Ggf im high level und der ISA weniger.

Apple hat womoeglich die ALUs radikal veraendert; die Effizienz ist mit Apple's internen Aenderungen so weit gestiegen dass sie zumindest auch Albiorix A nicht noetig hatten. Im Bereich featureset ist alles was in M1 steckt immer noch auf DX10.0. Nun gut es gibt zwar eine hw Tessellations-Einheit u.a. aendert aber auch nichts an der Komplianz. Ich glaube sie haben uebrigens auch die raster Einheiten umgeschrieben, bin mir aber nicht sicher.

Wie dem auch sei: man kann zwar N Architektur um ein sehr grosses Prozentual aendern, aber irgendwo kann man damit einige Grundlagen nicht ueberkreuzen. M1 und co ist nach wie vor ein TBDR, ist nach vor auf DX10.0 Niveau und hat auch die genau gleich Anzahl an SIMD Einheiten pro cluster wie Serie7.

Die heutige CTX mit allem drum und dran ist schon ein ganz anderes Tier und da hilft das umkrempeln bzw. Herstellungs-anpassungen irgendwo gar nichts mehr weit hoehere Effizienz-ziele + N hoeheres featureset zu erreichen. Alles natuerlich unter der Vorraussetzung dass ihre 128-er SIMDs auch so effizient sind wie sie selber behaupten, denn untersucht hat es bisher keiner ausser IMG's Kunden. Sie behaupten zwar kunterbuntes ueber "echte" superskalare Anpassungen aber marketing bleibt marketing auf Papier bis es von unabhaengigen Quellen oeffentlich untersucht wird.

davidzo

2021-12-03, 11:36:12

IMG verkauft IP und Innosilicon hat diesen gekauft obwohl sie es mit einem AMD bzw. NVIDIA oder anderem chip um einiges leichter gehabt haetten.

Nvidia ist keine Alternative im GPU-IP Business, zumindest aktuell noch nicht.
Und bei AMD ist wieder der Nachteil dass das eine texanische Firma ist und sie damit schnell ausgesperrt werden können, auch durch die Regierung Biden. Innosilicon sitz in Hubei, China und dass die Amis schnell mal irgendwelche Spionagevorwürfe erfinden um ihrer eigenen Wirtschaft einen Vorteil zu verschaffen ist kein Geheimnis, das ist die Realität wie sie selbst die EU schon zu spüren bekommen hat. Dieses Risiko ist auch privaten Firmen bekannt, das muss überhaupt nichts mit Government Funding zutun haben. Das Hygon Diana Dilemma hat bleibende Reputationsschäden für AMD in China nach sich gezogen. Da ist eine Lizenz von einer britischen Firma mit chinesischen Investoren unternehmerisch ein viel geringeres Risiko, und das ist womöglich gravierender als die Produktreife der IP.

Ailuros

2021-12-03, 12:44:55

Nvidia ist keine Alternative im GPU-IP Business, zumindest aktuell noch nicht.
Und bei AMD ist wieder der Nachteil dass das eine texanische Firma ist und sie damit schnell ausgesperrt werden können, auch durch die Regierung Biden. Innosilicon sitz in Hubei, China und dass die Amis schnell mal irgendwelche Spionagevorwürfe erfinden um ihrer eigenen Wirtschaft einen Vorteil zu verschaffen ist kein Geheimnis, das ist die Realität wie sie selbst die EU schon zu spüren bekommen hat. Dieses Risiko ist auch privaten Firmen bekannt, das muss überhaupt nichts mit Government Funding zutun haben. Das Hygon Diana Dilemma hat bleibende Reputationsschäden für AMD in China nach sich gezogen. Da ist eine Lizenz von einer britischen Firma mit chinesischen Investoren unternehmerisch ein viel geringeres Risiko, und das ist womöglich gravierender als die Produktreife der IP.

Weder NV, noch AMD haben ein Geschaeftsmodell wofuer purer IP Verkauf Sinn machen wuerde. Sonst kein Einwand zum obrigen aber Canyon Bridge ist indirekt zum chinesischen Staat verbunden und egal was sie anfangs anstellen wollten, sie haben tatsaechlich Imagination geholfen wieder etwas Gewinn zu erreichen als Firma denn nach dem Apple-Schlammasel war IMG verdammt nahe am Ruin.

Canyon Bridge selber:

https://canyonbridge.com/investment-strategy/

Canyon Bridge wird von China Reform Holdings unterstuetzt und das letztere ist eben Teil des chinesischen Staats.

Ob jetzt am Ende Innovision oder sonst wer von IMG IP lizenziert ist ziemlich wurscht. Irgendwo und irgendwie haette Canyon Bridge schon einen Kunden finden koennen in ganz China der GPU IP von IMG lizenziert hat fuer alternative cloud und desktop GPU Loesungen.

Zum Zeitpunkt wo das ganze Theater mit Apple angefangen hat war es innerhalb Imagination klar dass GPU IP fuer den mobilen Markt bald zum krepieren kommt. Noch schlimmer hat Samsung mit AMD eine semi custom GPU IP Loesung entwickelt ergo sind zwei Groessen schon mal weg vom Fenster und Qualcomm entwickelt ihre GPUs selber. Bleibt also nicht mehr nenneswertes uebrig wofuer man mit GPU IP ueberleben kann. Ergo musste IMG etwas finden um langfristig ueberleben zu koennen, wobei ein Anteil der Alternativen offensichtlich dGPUs in China war (bevor jetzt jemand "automotive" sagt: IMG hat zwar den groessten Markanteil fuer GPU IP in diesem aber da die Unterstuetzung fuer automotive ziemlich kompliziert ist, liegt diese Sparte konstant finanziell beim break even point). Naechste Alternative da sie gezwungen wurden MIPS zu verkaufen ist dann die von Grund auf Neuentwicklung von RISC-V basierender CPU IP welches wohl auch Interessen innerhalb von China sehr gut decken koennte.

China wollte wohl IMG aus der UK auswandern lassen, aber Gott sei Dank hat sich die britische Regierung zeitlich gewehrt: https://www.reuters.com/article/us-china-britain-imaginationtechnologies-idUSKBN21Z2FA

Ist auch besser so fuer China selber wenn man es bedenkt.

Uebrigens ging es mir nicht um die Produktreife. Ich weiss zwar nicht in welchem Zustand heutzutage IMG's windows Treiber sind, aber es waere wohl der einzige moegliche zweifelhafter Punkt fuer IMG; dass und starke und aktive Treiber-unterstuetzung fuer Spiele. Mit Deinen obrigen Punkten hasst Du zwar recht, aber einen fertigen GPU chip von NV zu kaufen ist jegliche politische Huerden mal ignoriert, einfacher und schneller als IP einzukaufen und darauf basierend eine dGPU auf den Markt zu bringen.

***edit: OT aber da ich das Management von IMG oefters erwaehne.....der groesste ihrer Fehler war dass sie sich zu stark auf Apple konzentriert haben und es nie eine wahre Alternative gab falls Apple sie irgendwann entlassen haette. Noch schlimmer gab es intern eine idiotische Philosophie wobei sie sich regelrecht ueber die Jahre auf ihren eigenen Lorbeeren ausgeruht haben. Immer wieder der TBDR Mist und wir sind die Besten und dies und das und als dann irgendwann potentielle Kunden bei Verhandlungen ihnen selber zeigten dass z.B. der damalige Mali sogar mehr Bandbreite sparen kann als ihr Super-TBDR oder dass QCOM eine verrueckt hohe Rate von GFLOPs/mm2 im Vergleich zum PowerVR hat, kamen so langsam die ersten Ohrfeigen dass sie bis zu dem Punkt wohl in einer Zeitschleusse entwickeln haben und das obrige Management damals so manches bloede 0815 Firmchen kaufte dass nur fraglichen Nutzen fuer IMG hatte und somit die wertvollen resources die sie eigentlich fuer R&D gebraucht haetten einfach verschwendet wurden....als es dann los ging mit Apple standen alle ploetzlich ziemlich bloed rum, sie hatten geraden Unsummen an royalties durch Apple verloren und waren mit ihrer IP gerade noch konkurrenzfaehig, wobei kein Wunder dass Mali danach fast alles uebrige aufgekehrt hat. Anfangs wo es IMG noch gut ging war bei Mediatek die GPU IP quasi geteilt zwischen ARM und IMG. Heutzutage lizenzieren sie nur noch eine Bruchteil von IMG und high end GPU IP fuer Mediatek's SoCs sind heute ausschliesslich ARM Mali https://www.anandtech.com/show/17070/mediatek-announces-dimensity-9000

robbitop

2021-12-03, 15:35:40

IIRC gibt es schon Entwicklerdokumentation für Raytracing von Apple. Pixeljetstream hatte das mal erwähnt und er ließ durchblicken, dass er da ziemlich beeindruckt von Apples Umsetzung war. Kann also sein, dass da bald eine deutliche Modernisierung in der uArch bei Apples GPU IP Blöcken kommt.

Ailuros

2021-12-03, 15:42:36

IIRC gibt es schon Entwicklerdokumentation für Raytracing von Apple. Pixeljetstream hatte das mal erwähnt und er ließ durchblicken, dass er da ziemlich beeindruckt von Apples Umsetzung war. Kann also sein, dass da bald eine deutliche Modernisierung in der uArch bei Apples GPU IP Blöcken kommt.

Komische Zufaelle; Caustic wurde von ex-Apple Angestellten gegruendet ;D

robbitop

2021-12-03, 15:55:17

Was hat eine zukünftige GPU IP von Apple mit heutigen IMG Mitarbeitern zu tun? (Apple->Caustic->IMG) Die Caustics Leute sind seit >10 Jahren bei Apple weg. Seit dem hat sich sicherlich eine Menge getan. Hat Apple denn zu IMG Lizenzzeiten denn auch die Caustic IP lizensiert?

Ailuros

2021-12-03, 16:13:17

Was hat eine zukünftige GPU IP von Apple mit heutigen IMG Mitarbeitern zu tun? (Apple->Caustic->IMG)

Ich bezweifle ernsthaft dass Apple NICHT wieder von IMG lizenziert.

Die Caustics Leute sind seit >10 Jahren bei Apple weg. Seit dem hat sich sicherlich eine Menge getan. Hat Apple denn zu IMG Lizenzzeiten denn auch die Caustic IP lizensiert?

Apple hat offiziell noch gar nichts lizenziert. Alles RT von IMG beruht auf ex-Caustic Patenten, die IMG erweitert und etwas neu aufgelegt hat.

Ailuros

2021-12-03, 16:46:44

Gerade frisch veroeffentlicht:

https://www.imaginationtech.com/news/press-release/imagination-b-series-gpu-ip-selected-for-innosilicon-graphics-card/

Fuer die vorige China-relative Debatte...

Roger Mao, Executive Vice President, Innosilicon, says, “With the domestic PC market growing in China, GPU innovation is becoming a crucial differentiator. In Imagination we found the right partner to help us deliver products that go above and beyond our customers’ expectations....

y33H@

2021-12-03, 19:47:48

Da kommt die Tage noch was on top.

Ailuros

2021-12-03, 21:32:35

Da kommt die Tage noch was on top.

:O

Loeschzwerg

2021-12-07, 10:17:58

"Imagination announces GPU licensing deal with YADRO":
https://www.imaginationtech.com/news/press-release/imagination-announces-gpu-licensing-deal-with-yadro/

Imagination Technologies announces that its ultra-efficient BXM-4-64 GPU has been licensed by YADRO Microprocessors, a fabless IC design house, subsidiary of YADRO, a leader in enterprise server and storage solutions in the Russian market.

Nicht schlecht, da tut sich doch einiges bei ImgTech.

Benutzername

2021-12-07, 12:41:20

Tja stellt sich die Frge ob PowerVR mittlerweile gute Treiber liefern kann. Im Linuxkernel haben sie ja immer Blobs reingepatcht (und auf mienem Motorola Razr waren ein paar Crashes und Glitches von der Grafik) und damals mit der Kyro II war das auch weniger überzeugend unter Windows.

Oder die chinesischen Gamer müssen sehr sehr leidensfähig sein. ;)

mboeller

2021-12-07, 21:15:55

@Y33h

das hier?

Imagination launches RISC-V CPU family (https://www.imaginationtech.com/news/press-release/imagination-launches-risc-v-cpu-family/)

Catapult CPU ...

Catapult CPUs are available in four distinct families: dynamic microcontrollers; real-time embedded CPUs; high-performance application CPUs; and functionally safe automotive CPUs.

edit:
https://www.anandtech.com/show/17104/imagination-launches-catapult-family-of-riscv-cpu-cores

Ailuros

2021-12-09, 15:16:40

@Y33h

das hier?

Imagination launches RISC-V CPU family (https://www.imaginationtech.com/news/press-release/imagination-launches-risc-v-cpu-family/)

Catapult CPU ...

edit:
https://www.anandtech.com/show/17104/imagination-launches-catapult-family-of-riscv-cpu-cores

Nebenbei kein Piep von Anandtech fuer CTX und fuer die CPU IP ploetzlich eine ganze Analyse. Interessant dass sie bis 2023 ein 3x Mal so grosses CPU team haben moechten laut IMG.

mboeller

2021-12-09, 16:17:57

Nebenbei kein Piep von Anandtech fuer CTX und fuer die CPU IP ploetzlich eine ganze Analyse. Interessant dass sie bis 2023 ein 3x Mal so grosses CPU team haben moechten laut IMG.

IMHO; die Catapult-CPU's sind für IMG wesentlich wichtiger als ein CTX. Durch die CPUs hat IMG jetzt ein "komplettes" SoC-Portfolio.

Was kurzfristig fehlt ist ein OoO 64bit Core wie bei SiFive:
https://www.golem.de/news/offene-befehlssatzarchitektur-sifive-hat-den-schnellsten-risc-v-kern-2110-160508.html

IMG braucht dafür noch min. 2, eher aber 3 Jahre laut der eigenen Roadmap. Erst mit diesen 64bit OoO Cores sind sie dann wirklich konkurrenzfähig zu anderen RISC-V IP-Firmen und ARM.

Roadmap: https://images.anandtech.com/doci/17104/Imagination%20RISC-V%20Catapult_Slide%20Deck_16.png

Ihr großer Vorteil im Vergleich zu anderen RISC-V Firmen ist, dass sie ein komplettes Portfolio haben und damit alles(?) aus einer Hand bieten können, ähnlich wie ARM.

Ailuros

2021-12-09, 16:54:54

IMHO; die Catapult-CPU's sind für IMG wesentlich wichtiger als ein CTX. Durch die CPUs hat IMG jetzt ein "komplettes" SoC-Portfolio.

Kommt drauf an als was sie Series C GPU IP genau verkaufen; handelt es sich um IP fuer dGPUs verdienen sie zich Male mehr an diesem als mit CPU IP.

Was kurzfristig fehlt ist ein OoO 64bit Core wie bei SiFive:
https://www.golem.de/news/offene-befehlssatzarchitektur-sifive-hat-den-schnellsten-risc-v-kern-2110-160508.html

IMG braucht dafür noch min. 2, eher aber 3 Jahre laut der eigenen Roadmap. Erst mit diesen 64bit OoO Cores sind sie dann wirklich konkurrenzfähig zu anderen RISC-V IP-Firmen und ARM.

Roadmap: https://images.anandtech.com/doci/17104/Imagination%20RISC-V%20Catapult_Slide%20Deck_16.png

Ihr großer Vorteil im Vergleich zu anderen RISC-V Firmen ist, dass sie ein komplettes Portfolio haben und damit alles(?) aus einer Hand bieten können, ähnlich wie ARM.

Mit dem "aehnlich wie ARM" beschreibt man sofort IMG's eigentliches Konkurrenz-ziel. Wobei ARM zich mal mehr Erfahrung und Vertrauen erweckt bei jeglichem potentiellem Kunden. Wird ARM von NV gekauft, hat IMG hier bessere Chancen etwas zu verkaufen hauptsaechlich in China. Im Gegenfall steht selbst ARM selber auf wackligen Beinen da Apple und co. momentan nur Architektur-Lizenzen benutzen und womoeglich langfristig sich sowieso von ARM loesen werden.

Anders: IP wird zunehmend weniger wichtig werden im mobilen Markt u.v.a.

Loeschzwerg

2021-12-22, 11:36:41

Falls es noch keiner entdeckt hat, Innosilicon listet nun die Specs der Typ A und B Karten, inkl. Kontaktformular für Firmen: https://www.innosilicon.cn/home/Index/gpu.html

DX11/12 irgendwann 2022, GPU in 12nm... 20W Leistungsaufnahme bei Desktop Anwendungen.

P.S.: Der Bilderupload hier im Forum ist immer noch beschissen :mad:

konkretor

2021-12-22, 12:56:52

Jo Bilder Upload ist echt zum brechen, macht kein spaß.

Zurück zum Thema

Super das du das ausgegraben hast.

HOT

2021-12-22, 13:30:46

Cool für Röhrenmonitorbesitzer, das Teil hat offenbar noch nen RAMDAC :D.

y33H@

2021-12-22, 15:04:59

Ich hab jez endlich nen Kontakt zu denen hergestellt, nun bin ich gespannt :ulove:

Benutzername

2021-12-22, 16:58:28

Cool für Röhrenmonitorbesitzer, das Teil hat offenbar noch nen RAMDAC :D.

In Asien sind durhcaus noch Röhrenmonitore im Einsatz. Dann im industrieumfeld überall auf der Erde sowieso und auch viele Projektoren haben noch VGA-Eingänge. Gibt also noch Bedarf dafür.

Loeschzwerg

2021-12-22, 19:41:26

nun bin ich gespannt :ulove:

Wir hier auch :D

konkretor

2021-12-23, 09:19:06

Mal sehen ob du 10 000 Stück abnehmen musst, also eine würd ich nehmen. Dann wären nur noch 9999 zu Verteilen. Leider sind meine Kontakte in die Distributionswelt nicht mehr vorhanden, zu lange her.

https://www.channelpartner.de/k/distribution,3491 ganz nach unten Scrollen sind alle wichtigen Distris aufgelistet die man Anfragen könnte, falls es nur solche Mengen möglich sind.

y33H@

2021-12-23, 11:35:46

Schauen wir mal, ob und was Innosilicon sagt - ich bin da vorerst verhalten, lasse mich aber gerne positiv überraschen.

EDIT:

Wie kriegen die eigentlich 10 Teraflops mit zwei Chiplets hin? Selbst BXT 32-1024 MC4 als Quad-Chiplet-Aufbau mit 1,5 GHz schafft "nur" 6 Teraflops (FP32) ...

Das sieht mir hier links im Bild eher aus wie vier Chiplets, die man dann aber auf nen äußerst hohen Takt prügeln müsste.

77813

davidzo

2021-12-23, 12:45:16

Schauen wir mal, ob und was Innosilicon sagt - ich bin da vorerst verhalten, lasse mich aber gerne positiv überraschen.

EDIT:

Wie kriegen die eigentlich 10 Teraflops mit zwei Chiplets hin? Selbst BXT 32-1024 MC4 als Quad-Chiplet-Aufbau mit 1,5 GHz schafft "nur" 6 Teraflops (FP32) ...

Das sieht mir hier links im Bild eher aus wie vier Chiplets, die man dann aber auf nen äußerst hohen Takt prügeln müsste.

77813

Verstehe nicht was das problem ist. PowerVR Module müssen ja nicht gleich einzelne Chiplets sein, bisher waren die eigentlich immer monolitisch.

5Tflops / 160Gpixel passen exakt zu einem BXT 32-1024 MC4 @ 1,25Ghz. Das ist auch ein realistischer Takt angesichts dass hier immer noch ein "altes" 12nm Verfahren zu Zuge kommt. Taktschätzungen von IP Vendors wie ARM als auch PowerVR gehen immer vom optimistischen Case aus (N7+?) und liegen damit eigentlich immer leicht über den in der praxis gewählten Taktraten.

Das 10Tflop Board sind einfach 2x MC4 Chips. Imagination hat zwar afaik keinen Interconnect für mehr als 4x Module, aber für viele Anwendungen braucht man auch keinen. Das sind einfach zwei einzelne GPUs auf einem PCB, ganz wie zu AMD RV670 Zeiten...
Virtualisierung oder Mining etc. läuft genau so gut auf zwei einzelnen GPUs wie einer größeren. Wenn dass der Fall ist, wäre die Dualchip Konstruktion eben nicht für den Gaming-Endkunden gedacht, sondern für Server oder Workstations. Xindong/Innosilicon gibt ja auch an dass die Type-A Karte für 16x 1080P User gedacht ist während die Dualchip Karte 32 User serven soll. TripleA 3D Spiele können damit also wohl nicht gemeint sein.

Innosilicon ist schon länger Entwicklungspartner von SMIC für ihre Advanced Nodes und auch einer der größeren Investoren in SMIC. Möglicherweise ist der verwendete "12nm" Node also eine SMIC Produktlinie, was das ganze noch spannender macht imo. Wir bekommen hier das erste mal Chinas cutting Edge Technologie zu sehen.

y33H@

2021-12-23, 13:05:30

Vielleicht sitze ich hier einem Missverständnis auf, aber ImgTech sprach für MC4 ganz klar von vier (physischen) Chiplets, was jedoch wohl nur als Option zu verstehen ist und Innosilicon packt halt den MC4 in ein Single-Die ... da passt deine Aussage mit BXT 32-1024 MC4 @ 1,25 GHz freilich wunderbar - vor allem bei 12 nm SMIC.

davidzo

2021-12-23, 13:45:30

Vielleicht sitze ich hier einem Missverständnis auf, aber ImgTech sprach für MC4 ganz klar von vier (physischen) Chiplets, was jedoch wohl nur als Option zu verstehen ist und Innosilicon packt halt den MC4 in ein Single-Die ... da passt deine Aussage mit BXT 32-1024 MC4 @ 1,25 GHz freilich wunderbar - vor allem bei 12 nm SMIC.

Wo sprachen die von chiplets?

Soweit ich weiß sprechen sie nur von "Multicore". Das ist dieselbe Sprache die seit Jahrzehnten im mobile steht und auch von Mitbewerbern so genutzt wird: Apples M1 hat eine 8-Core Apple GPU (RogueXT), Googles Tensor SOC hat eine 20Core GPU (Mali G78) . Das sind alles monolitische Socs, ich bezweifele sogar dass das fabric für die Cores überhaupt mit Chiplets überhaupt funktionieren würde, stammt die Grundlage doch aus einer zeit noch weit bevor es Adcanced packaging gab.

Btw, Anandtech hatte die Fantasy GPUs schon 2020 erwähnt, als Launchpartner von IMGtecs Series B:
https://www.anandtech.com/show/16155/imagination-announces-bseries-gpu-ip-scaling-up-with-multigpu/5

Das war damals irgendwie an mir vorbei gefallen wie der sprichwörtliche Sack Reis.

Interessante Details:

Industry sources say that the major demand-driver for Imagination GPU IP right now is the high-performance GPU market in China, where there’s apparently a major hunger and need for domestic designs that are disconnected from US suppliers such as AMD and Nvidia.

Die wussten also schon zum Series-B launch dass die Nachfrage aus dem Desktop kommt und eher High performance als mobile ist. Die µArch wird damals schon festgeklopft gewesen sein, basiert ja auch stark auf Series A, aber denen muss bewusst sein dass die Kunden eher Desktop-designs sehen wollten. Die Auswirkungen dieser Nachfrage werden wir vielleicht schon mit Series-C sehen.

Ein Pikantes Detail ist außerdem das ausgerechnet Innosilicon in China die IP für den von nvidia in der Geforce Ampere Series genutzten GDDR6X Speichercontroller entwickelt hat. Das ist insofern interessant als das AMD für Navi wahrscheinlich eher konservativ im Valley eingekauft hat, höchstwahrscheinlich den Cadence Denali GDDR6 Controller.
One such design win is Innosilicon’s recently announced “Fantasy” graphics cards series. Innosilicon to date was known as an ASIC IP design house for various miscellaneous IP blocks, such as providing Nivdia’s GDDR6’s memory controllers.

y33H@

2021-12-23, 14:47:25

Klassisch ist MC einfach Multicore - im Briefing zu BXT bzw Barrex allgemein hat IMG jedoch mehrfach betont, dass das Design (auch) für Chiplets ausgelegt ist ... hatte Anandtech ebenfalls erwähnt:
Because of this, this is a design that’s particularly fit for today’s upcoming multi-chiplet silicon designs.Aber ja, schon damals wurde Innosilicon als Partner für Barrex genannt, hatte ich in der News drin ... bin sehr gespannt, was da bei rum kommt!

konkretor

2021-12-29, 15:32:26

https://wccftech.com/chinese-gpu-maker-innosilicon-debuts-its-first-domestically-produced-graphics-cards-first-demo-up-to-10-tflops-32-gb-gddr6x-memory/?utm_source=dlvr.it&utm_medium=twitter

Ailuros

2022-01-05, 13:38:24

Am Rand erwaehnt uebrigens IMG fuer die Unterstuetzung; kein Piep fuer D3D oder windows welches wohl schwer ein Zufall sein kann:

https://www.imaginationtech.com/markets/desktop/

OGL, Vulkan and Beyond

We have the software you need for success including OpenGL, OpenGL ES and Vulkan API support and advanced developer tools such as PowerVR Carbon, our powerful API tracing and debugging tool and PVRTune, our industry-leading profiling and analysis utility for graphics applications.

Our developer community is vast, and with the Imagination Developer Portal, you can find resources and advice on the best way to utilize the feature-rich PowerVR Tools suite.

konkretor

2022-01-20, 08:31:21

Innosilicon to make 5nm GPU in 2022

Paywall

https://digitimes.com/news/a20220117PD207.html

Von hier

https://www.techpowerup.com/291097/chinese-gpu-makers-aiming-for-5-and-7-nm-gpus-in-2022

Loeschzwerg

2022-01-20, 08:51:09

Ist dann vielleicht schon der Nachfolger mit C Series als Basis.

Ailuros

2022-01-21, 07:22:12

Ist dann vielleicht schon der Nachfolger mit C Series als Basis.

https://digitimes.com/news/a20220117PD207.html

China-based GPU developer Innosilicon is planning to begin wafer production for its in-house developed GPU, Fantasy One, in 2022; the chip will be manufactured via a 5nm node and support a ray tracing technology.

Leonidas

2022-01-24, 07:16:36

Naja, die werden 2022 bestenfalls das Design fertigstellen - aber nix mit Produktion. Die haben noch nichtmal Fantasy 1 real im Markt stehen. So schnell schießen auch die Chinesen nicht.

Ailuros

2022-01-25, 10:28:21

Naja, die werden 2022 bestenfalls das Design fertigstellen - aber nix mit Produktion. Die haben noch nichtmal Fantasy 1 real im Markt stehen. So schnell schießen auch die Chinesen nicht.

Naja digitimes ist halt digitimes und es dann auch so dass selbst der 31/12/2022 immer noch zu 2022 gehoert selbst beim allerersten tapeout :biggrin:

So oder so ist es auch ziemlich wurscht da es sich hauptsaechlich fuer Produkte fuer China handelt. Ohne windows Unterstuetzung sind die GPUs selbst dort von fraglichem Nutzen.

Loeschzwerg

2022-04-11, 12:49:48

Ein paar neue Infohäppchen gibt es zu Innosilicon und der verwendeten Innolink Technologie:
https://www.innosilicon.cn/home/News/index/id/128.html
https://www.innosilicon.com/html/ip-solution/20.html

Die Fantasy 1 Serie wurde zudem erfolgreich für UOS evaluiert:
https://www.innosilicon.cn/home/News/index/id/129.html

Ailuros

2022-04-14, 19:36:57

Ein paar neue Infohäppchen gibt es zu Innosilicon und der verwendeten Innolink Technologie:
https://www.innosilicon.cn/home/News/index/id/128.html
https://www.innosilicon.com/html/ip-solution/20.html

Die Fantasy 1 Serie wurde zudem erfolgreich für UOS evaluiert:
https://www.innosilicon.cn/home/News/index/id/129.html

Falls es interessieren sollte, windows support kommt wohl doch noch dazu, wenn ich mich nicht irre ab H2 22'.

Ailuros

2022-05-04, 12:13:58

Wenn IP generell und die politisch relativen Vorschlaege fuer eine alternative UK Politik interessieren sollte, lohnt sich der download des research reports von IMG:

https://www.imaginationtech.com/news/onshoring-chip-production-is-a-red-herring-the-uk-should-double-down-on-its-competitive-advantage-in-rd-and-ip-to-create-a-secure-semiconductor-supply-chain/

Falls die UK Politiker irgendwann aufwachen und verstehen dass IP nicht fuer "I pee", sondern "intellectual property" steht, geht die gesamte Affaere vielleicht einen Schritt weiter :freak:

mboeller

2022-05-12, 13:36:41

IMG Series4-NNA Leistungswerte bei Superresolution (AI based upscaling von Bildern und Video)

https://blog.imaginationtech.com/seeing-whats-not-there.-imaginations-img-series-4-nna-meets-visidons-deep-learning-based-super-resolution-technology

Table 1: Visidon Super-Resolution network performance on the IMG Series4 NNA compute engine (converting 1080p video to 4K resolution) ::

https://blog.imaginationtech.com/hs-fs/hubfs/Blog_Asset/figure2-performance-corrected.png?width=1710&name=figure2-performance-corrected.png

nicht mal so schlecht im Vergleich zu einer 2080Ti

very fast bicubic quality inferencing (VD1)
fast and better than bicubic quality inferencing (VD2)
highest quality super-resolution for still images (VD3).

Die Bildvergleiche poste ich hier mal nicht. Sie schauen für mich zu gut aus um real zu sein. Wenn VD3 wirklich so gute Resultate liefert, dann WOW³³

Ailuros

2022-05-18, 09:34:04

IMG Series4-NNA Leistungswerte bei Superresolution (AI based upscaling von Bildern und Video)

https://blog.imaginationtech.com/seeing-whats-not-there.-imaginations-img-series-4-nna-meets-visidons-deep-learning-based-super-resolution-technology

Table 1: Visidon Super-Resolution network performance on the IMG Series4 NNA compute engine (converting 1080p video to 4K resolution) ::

https://blog.imaginationtech.com/hs-fs/hubfs/Blog_Asset/figure2-performance-corrected.png?width=1710&name=figure2-performance-corrected.png

nicht mal so schlecht im Vergleich zu einer 2080Ti

Die Bildvergleiche poste ich hier mal nicht. Sie schauen für mich zu gut aus um real zu sein. Wenn VD3 wirklich so gute Resultate liefert, dann WOW³³

Deshalb: https://www.imaginationtech.com/news/imagination-and-visidon-partner-for-deep-learning-based-super-resolution-technology/

mboeller

2022-05-18, 10:17:04

Deshalb: https://www.imaginationtech.com/news/imagination-and-visidon-partner-for-deep-learning-based-super-resolution-technology/

Danke.
das Video ist cool: https://www.youtube.com/watch?v=v6nuT98thkw

mboeller

2022-08-26, 09:34:06

IMG hat gerade einige RISC-V / PowerVR Sachen neu in der Pipeline:

mit Alibaba:
https://www.imaginationtech.com/news/imaginations-gpu-and-ai-accelerator-licensed-for-the-latest-aiot-risc-v-based-applications/

T-head has unveiled its latest chip development platform, named Wujian 600, during the RISC-V China Summit on August 24. Also revealed was the TH1520, a high-performance RISC-V based SoC developed from the platform. The TH1520’s CPU can offer performances of up to 2.5GHz. ...
TH1520 uses Imagination’s BXM-4-64 GPU IP, a core from its high-efficiency performance GPU family ...
Also included in the SOC is the PowerVR AX3386 AI accelerator, part of the award-winning Series3NX NNA cores. It offers up to 5 TOPS

mit StarFive:
https://www.imaginationtech.com/news/imagination-gpu-selected-by-starfive-for-next-generation-visionfive-2-single-board-computer/

https://www.golem.de/news/risc-v-leistungsfaehigere-chips-mit-3d-grafik-und-flug-ins-all-2208-167808.html

Loeschzwerg

2022-08-30, 16:23:29

ImgTec feiert 30 Jahre PowerVR und zeigt in einem Blog-Post eine Innosilicon Fantasy 1 (Type A):
https://blog.imaginationtech.com/celebrating-imaginations-30th-anniversary-looking-back-moving-forward

So wie es aussieht steckt die Karte auf einem ASRock Z690 PRO RS d.h. läuft auf einem aktuellen x86 System.

80368

Edit:
https://youtu.be/_A8OxhTNE_I?t=727

Bei 12:07 sieht man die Karte für einen kurzen Moment.

konkretor

2022-08-30, 20:09:38

Will endlich so eine Karte haben!!!111

konkretor

2022-09-06, 12:57:20

https://www.pcgameshardware.de/Grafikkarten-Grafikkarte-97980/News/Imagination-Technologies-kuendigt-Rueckkehr-ins-Desktop-Geschaeft-an-1402596/

Ailuros

2023-01-27, 08:24:55

War bis jetzt zu faul es zu posten. IMG kuendigte am 11/01 einen CXT refresh unter dem Namen DXT an.

Bei 1GHz erreicht ihrer rein hypothetische high end smartphone GPU 2.5 TFLOPs FP32 und es kommen noch ein paar interessante Faehigkeiten wie FSR und 2D dual rate texturing dazu:

https://www.imaginationtech.com/news/imaginations-img-dxt-gpu-unlocks-scalable-premium-ray-tracing-for-all-mobile-gamers/

Von Lizenzen wird noch nichts erwaehnt, wobei sie mehrere Lizenznehmer bei der CXT Vorstellung behaupteten, aber es wird wohl noch eine Weile dauern bis irgend ein SoC mit diesen erscheint ueberhaupt wenn die Lizenzen in Maerkten wie z.B. automotive waren.

davidzo

2023-01-27, 12:15:13

Ich fände es toll wenn man Apple wieder als Lizenznehmer an Bord hätte.
Es gibt ja das Gerücht dass die Apple-eigene GPU mit RT die für den M2 geplant war in internen Tests gescheitert ist, vor allem am power draw und PPA, wahrscheinlich amplifiziert durch die Probleme und Verspätungen von TSMCs 3nm Prozesses. Apple hätte sich daher entschieden nur einen M1 Refresh zu bringen, was ja auch passiert ist. Ob die Apple GPU wirklich ein komplettes Eigendesign ist oder auch irgendwo Lizensiert ist nicht bekannt, aber ich könnte mit vorstellen dass DXT jetzt auf dem Tisch liegt für den nächsten Versuch. Apple mag keine Fehlschläge und seitzt lieber auf dual sourcing wenn das inhouse noch nicht klappt. Und nochmal kann man die veraltete Rogue IP ohne RT nicht mehr bringen in 2024 und so weiter. Falls die ursprüngliche M2 GPU aber kein reines Eigengebräu sondern mit CXT verwandt war, könnte DXT ja sogar eine Reaktion auf die Erfahrungen damit gewesen sein.
Mit Apple als Zugpferd kann die Umsetzung deutlich schneller kommen als im sonstigen Lizenznehmermarkt.

Ailuros

2023-01-27, 13:37:52

Mit Apple als Zugpferd kann die Umsetzung deutlich schneller kommen als im sonstigen Lizenznehmermarkt.

Stimmt schon wenn dem so ist; davon hat aber IMG im Grund wenig bis gar nichts. Wuerde Apple bei jeglicher API Definierung von anderen sw Platformen aktiver Entscheidungen beinflussen, dann waere es natuerlich ein indirekter grosser Gewinn fuer IMG.

IP Schmieden machen ihre "fetten" Umsaetze hauptsaechlich von royalties/chip, welche aber schon seit einer Ewigkeit fuer Apple dank Architektur-only-Lizenz entfaellen. Der Vorteil ist dann eben dass IMG freie resources hat eben nicht hauptsaechlich fuer Apple zu entwickeln und optimieren und klingt auch schoen als These, bringt aber auch wiederrum nichts wenn keiner der grossen Semis keine GPU IP mehr lizenzieren will.

In der Android Welt lizenziert von den grossen Semis nur noch Mediatek und IMG ist heutzutage von hauptsaechlich kleinen Lizenznehmer und anderen Maerkten irgendwo ein Prozentual von ca. 30% vom GPU IP Kuchen in ULP SoCs uebrig geblieben und dieses dank automotive von diesem sie so oder so trotz groesstem IP Marktanteil (denk zu hohe Unterstuetzungs-kosten) nicht gerade irgenwelchen Gewinn machen.

IP fuer desktop GPUs in China war/ist eins der Alternativen zum Verlust von ULP Markanteilen aber bis jetzt gab es nur eine Implementierung von Innosilicon die hoffentlich nicht auch wieder zu einer Eintagsfliege wird.

Uebrigens hier das volle whitepaper fuer DXT, RT etc. https://resources.imaginationtech.com/hubfs/gated-files/raytracing/powervr-photon-whitepaper-en-jan23.pdf

robbitop

2023-01-28, 09:46:24

Ich fände es toll wenn man Apple wieder als Lizenznehmer an Bord hätte.
Es gibt ja das Gerücht dass die Apple-eigene GPU mit RT die für den M2 geplant war in internen Tests gescheitert ist, vor allem am power draw und PPA, wahrscheinlich amplifiziert durch die Probleme und Verspätungen von TSMCs 3nm Prozesses. Apple hätte sich daher entschieden nur einen M1 Refresh zu bringen, was ja auch passiert ist. Ob die Apple GPU wirklich ein komplettes Eigendesign ist oder auch irgendwo Lizensiert ist nicht bekannt, aber ich könnte mit vorstellen dass DXT jetzt auf dem Tisch liegt für den nächsten Versuch. Apple mag keine Fehlschläge und seitzt lieber auf dual sourcing wenn das inhouse noch nicht klappt. Und nochmal kann man die veraltete Rogue IP ohne RT nicht mehr bringen in 2024 und so weiter. Falls die ursprüngliche M2 GPU aber kein reines Eigengebräu sondern mit CXT verwandt war, könnte DXT ja sogar eine Reaktion auf die Erfahrungen damit gewesen sein.
Mit Apple als Zugpferd kann die Umsetzung deutlich schneller kommen als im sonstigen Lizenznehmermarkt.

Ich würde mich wundern, wenn von Rogue noch so viel übrig wäre. Das Ding wurde ja seit Jahren selbst entwickelt und es gab ja schon einige Iterationen. Ggf ist das Ding noch so Rogue wie noch Fermi IP in Pascal steckt. Ist ja alles Evolution.

chithanh

2023-01-30, 13:24:50

Ich würde mich wundern, wenn von Rogue noch so viel übrig wäre.Apple hat sukzessive PowerVR IP mit Eigenentwicklungen ersetzt, vgl. auch https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/15940

Aber das Programmiermodell haben sie anscheinend zu erheblichen Teilen beibehalten. Die öffentliche PowerVR-Doku und der Treiber-Code waren für das Asahi-Projekt nützlich https://rosenzweig.io/blog/asahi-gpu-part-5.html u.a.

Ailuros

2023-01-30, 14:58:36

Apple hat sukzessive PowerVR IP mit Eigenentwicklungen ersetzt, vgl. auch https://gitlab.freedesktop.org/mesa/mesa/-/merge_requests/15940

Ein kompletter von Grund auf design ist es auf jeden Fall nicht. Das was sie hauptsaechlich "umgeschrieben" haben waren ALUs und dafuer sind die Analogien der Einheiten (ALUs:TMUs: ROPs) gleich wie in IMG GPU IP der letzten Jahre, es sind nach wie vor deferred renderers und benutzen u.a. immer noch proprietaere IMG Textur-Kompression, sonst waere es auch nicht notwendig gewesen seitens Apple ihre Architektur-Lizenz vor einiger Zeit zu erneuern.

Aber das Programmiermodell haben sie anscheinend zu erheblichen Teilen beibehalten. Die öffentliche PowerVR-Doku und der Treiber-Code waren für das Asahi-Projekt nützlich https://rosenzweig.io/blog/asahi-gpu-part-5.html u.a.

Kommt drauf an was Du mit Programmiermodell genau meinst. ALUs sind erstmal fundamental anders ausgelegt in den letzten paar Apple GPU Generationen, wobei es wohl auch komplett unbekannt ist ob die Auslastung der ALUs besser oder schlechter bei den letzten ist. Persoenlich wuerde ich auf bessere Auslastung und Effizienz fuer die Apple Modifikation tippen, da sie bis jetzt zumindest zwei Albiorix GPU Generationen von IMG ausgelassen haben.

Es waere mal hoechstinteressant wenn jemand selbst eine M1 GPU gegen einen ausfuehrlichen test jagen koennte, und dabei wuerde es mich verdammt ueberraschen wenn diese fuer die ALU Praezision erstmal DX11 Komplianz erreichen koennen.

Fuer Apple selber und ihre sw Platformen ist das letzte sowieso zugegeben wenig bis gar nichts wert, der springende Punkt im gegebenen Fall ist dann eben schon inwiefern Apple und wieviel genau von der originalen GPU IP geaendert hat. Als wir Nebuchadnezzar oeffentlich bei beyond3d fragten ob es sich um eine "volle" custom GPU handelt, war seine Antwort deutlich negativ.

mboeller

2023-02-16, 08:08:38

Hallo;

über einen Reddit-Thread bin ich zum neuen (Jan`23) Whitepaper von IMG über ihre neue DXT-GPU IP gekommen.

Darf man hier Sachen aus dem Whitepaper posten, oder riskiert man dafür eine Sperre?

Vor allem der "Beyond-Desktop" Sketch vom DXT wäre es IMHO wert ein wenig Verbreitung zu finden. Da jeder DXT-"Chiplet" so 2,25TFlops hat (bei 1GHz) wären es dann in Summe so 36TFlops (4x4 "Chiplet")

Loeschzwerg

2023-02-16, 08:14:24

Darf man hier Sachen aus dem Whitepaper posten, oder riskiert man dafür eine Sperre?

Die Sachen sind bereits im Netz, also mach einfach ;) Wenn du auf Nummer sicher gehen willst, also z.B. mit Screenshots o.ä. und irgendeine vermeintliche Gefahr vom Forum fernhalten willst, dann nimm einen externen Hoster wie Abload und Co.

mboeller

2023-02-16, 08:29:41

nun denn...

Den Link zum Whitepaper findet man hier:
https://www.reddit.com/r/hardware/comments/10a0qc8/january_2023_update_img_dxt_white_paper/

Hosting von Pics muss ich mal schauen. Der Beyond-Desktop Sketch ist auf Seite 17.

Was ich am komischsten fand war, wie ihr Multi-GPU System funktioniert. Eigentlich ist das eher so was wie AFR und trotzdem denken sie, dass ihr System performant ist:

Decentralised Multi-Core
The traditional approach to GPU scalability is limited by the connections between centralised
shared blocks and the shader cores. Typically, the shared logic includes a centralised memory
data path, job manager and geometry tiling engines. The central dependency generates a starnetwork-
style structure where all cores need to be connected to this single centralised entity.
However, this causes issues with congestion and layout flexibility.
Imagination’s novel approach to multi-core instantiates a flexible number of GPU cores without
a direct dependency on a connection to a central unit. In its simplest form, this can be seen as
multiple GPUs, which are present in an SoC design, but with the ability for cores to jointly work
on compute and graphics processing. Each core within this approach is designed as a fully
independent GPU, containing all the functionality required to self-manage and execute workloads
based on priority.
The fundamental change to previous layouts is that instead of a single core directly working on a
workload we now have multiple GPU instances sharing command streams and jointly finishing the
work as quickly as possible. By working on distinct regions of the work (the render target) in each
GPU core our bandwidth efficiency is maintained, as each core continues to work on a coherent
region of the screen, thus ensuring maximal cache hit efficiency. A similar approach also applies
to other processing types, including geometry and compute processing, which can be assigned
to different GPU cores for processing.

Aber vielleicht funktioniert das bei ihnen aufgrund des TBDR wesentlich besser als bei normalen GPU's ????

Wenn es so, wie dargestellt funktionieren sollte, dann wäre es wirklich möglich mit einem Highend-DXT System die gleiche Leistung zu erreichen wie AMD und Nvidia (naja theoretisch zumindest, Intel und MTT zeigen ja das die Treiber auch extrem wichtig sind)

robbitop

2023-02-16, 09:00:08

Ich finde nicht, dass sich das nach AFR liest. Es ist leider sehr vage beschrieben aber IMO passt das eher zu sowas wie "supertiling".

Loeschzwerg

2023-02-16, 09:42:16

nun denn...

Das Whitepaper hatte Ail sogar schon in seinem Beitrag vom 27.01. verlinkt, also alles gut :)

und MTT zeigen

Diesbezüglich (MTT S80) möchte ich mal einhaken und die Hinweise eines Twitter Nutzers (@hikimiru) hier bequatschen. Diese erklären vermutlich ein Stück weit den Flaschenhals bezüglich Geometrie.

Generell galt für Pre A/B Series folgendes:
Tessellation and geometry shaders should be avoided if possible => https://docs.imgtec.com/performance-guides/performance-recommendations/topics/geometry-tessellation-shaders.html

Zu B Series (BXE) schrieb Anandtech damals dann folgendes:
The most interesting aspect of the multi-GPU approach is found in the BXE series, which is Imagination’s smallest GPU IP that purely focuses on getting to the best possible area efficiency. Whilst the BXT and BXM series GPUs until now are delivered as “primary” cores, the BXE is being offered in the form of both a primary as well as a secondary GPU implementation. The differences here is that the secondary variant of the IP lacks a firmware processor as well as a geometry processing, instead fully relying on the primary GPU’s geometry throughput. Imagination says that this configuration would be able to offer quite high compute and fillrate capabilities in extremely minuscule area usage.
=> https://www.anandtech.com/show/16155/imagination-announces-bseries-gpu-ip-scaling-up-with-multigpu/2

Jetzt müsste man natürlich zunächst wissen was MTT nun wirklich als Basis (BXE oder BXT) verwendet bzw. wie sehr man hier und da Anpassungen vorgenommen hat. Nach den bisherigen Test scheint es zumindest massiv an der Arbeitsteilung bezüglich Geometrie zu haken und ich sehe so ein Problem auch für DXT gegeben, bezüglich einer "Beyond-Desktop" Konfiguration. Mit DXT hat man das ganze "Setup" zwar verbessert (Stichwort Pipelining), aber ob sich das auch immer so in der Praxis dann ausgeht?

https://www.forum-3dcenter.org/vbulletin/attachment.php?attachmentid=82790

Ailuros

2023-02-17, 10:54:05

nun denn...

Den Link zum Whitepaper findet man hier:
https://www.reddit.com/r/hardware/comments/10a0qc8/january_2023_update_img_dxt_white_paper/

Hosting von Pics muss ich mal schauen. Der Beyond-Desktop Sketch ist auf Seite 17.

Was ich am komischsten fand war, wie ihr Multi-GPU System funktioniert. Eigentlich ist das eher so was wie AFR und trotzdem denken sie, dass ihr System performant ist:

Aber vielleicht funktioniert das bei ihnen aufgrund des TBDR wesentlich besser als bei normalen GPU's ????

Wenn es so, wie dargestellt funktionieren sollte, dann wäre es wirklich möglich mit einem Highend-DXT System die gleiche Leistung zu erreichen wie AMD und Nvidia (naja theoretisch zumindest, Intel und MTT zeigen ja das die Treiber auch extrem wichtig sind)

Loeschzwerg hat das decentralized multi-core Zeug schon aufgeklaert und robbitop hat auch recht dass sie bei multi-core eine Form von super- bzw. hierarchical tiling benutzen.

PowerVR's erste multi-core configs waren wenn ich mich nicht irre zu Naomi2 Arcade Zeiten, zwei GPU cores die jeweils gerade und ungerade tiles bearbeiteten (eben genauso primitiv wie damals 3dfx mit der Aufteilung von odd/even lines fuer scan line interleaving) und einen zusaetzlichen Geometrie-core der auch als Bruecke zwischen den beide GPU cores diente. Haette 3dfx ueberlebt haetten wir aehnliche setups mit einem Geometrie-core als Bruecke fuer multi-core GPUs in der Rampage und Fear GPU Generation gesehen.

PowerVR's neueste multi-core configs sind mit SGX MPs erschienen wobei sie schon damals nach eigenen Patenten auf viewports bzw. macro tiles zwischen den cores aufteilten wobei danach es mit micro-tiling weitergeht.

Nebenbei: keine Ahnung wie es seit Albiorix aussieht, aber bis zu Furian und egal wie viele cores war jeglicher setup stets bis auf 1 Tri/clock begrenzt und das sogar egal ob es sich bei einem MPx um x-Anzahl von raster units handelte.

mboeller

2023-03-21, 14:28:58

witzig...

IMG BXM GPU wird sogar bei Handys eingesetzt.
Mediatek hat den Dimensity 930 SoC der eine BXM-8-256 GPU enthält. Wird zumindest von Motorola beim G73 Handy und von Vivo beim Y77 Handy in China benutzt.

https://blog.imaginationtech.com/imagination-at-gdc-2023-quaternions-multi-core-ray-tracing-and-more

Ailuros

2023-03-24, 09:28:37

witzig...

IMG BXM GPU wird sogar bei Handys eingesetzt.
Mediatek hat den Dimensity 930 SoC der eine BXM-8-256 GPU enthält. Wird zumindest von Motorola beim G73 Handy und von Vivo beim Y77 Handy in China benutzt.

https://blog.imaginationtech.com/imagination-at-gdc-2023-quaternions-multi-core-ray-tracing-and-more

Sind aber auch nur =/< mainstream Geraete. Die GPU taktet bei 900MHz (single cluster 128SPs), ergo 230,4 GFLOPs FP32.

Ohne smartphone high end GPUs bekommen wir leider selten mit was und wo drinsteckt. Zb in automotive wissen wir selten was los ist: https://www.imaginationtech.com/news/imagination-and-telechips-drive-automotive-display-diversity-with-hardware-virtualization/

mboeller

2023-07-06, 10:20:34

vielleicht wird es ja nun doch noch was mit den Treibern:

https://blog.imaginationtech.com/imagination-gpus-now-support-opengl-4.6

Zumindest mal OpenGL 4.6

Loeschzwerg

2023-07-06, 11:03:08

Zumindest hat Moore Threads jetzt einen offiziellen Ubuntu Treiber für die MTT S80 rausgebracht:
https://developer.mthreads.com/driver-info/MTT_S80/release-note/v2.1.0?osv=Ubuntu

Moore Thread Software: MTT S-Series Linux Desktop Driver: 2.1.0
Driver version: v2.1.0
Published: July 4, 2023
release notes
New feature experience
1. Support OpenGL 4.0;
2. Support Vulkan 1.3;
3. Support DKMS function, mainstream kernel KAPI decoupling;
4. Added the function of viewing GPU information in GMI terminal mode;
5. Drive performance and stability are further improved;
Supported Graphics Card Models
1. MTT S80
Supported OS
1. Support Ubuntu 20.04.1, Kernel not lower than 5.4.0.42
Motherboards that support Resize BAR and Above 4G feature chipsets
known limitations
1. You need to enable the Resize BAR and Above 4G functions of the motherboard, otherwise the GPU memory cannot be recognized correctly;
2. On some motherboards that do not support PCIe Gen5, you need to set the PCIe rate from auto to PCIe Gen4 rate;
3. You need to install lightdm and unity-greeter before installing the driver. (Installation method: in terminal mode, enter apt install lightdm unity-greeter);
bug fixed
1. Solve the problem of freezing when switching tabs in Chrome browser;
2. Solve the problem that when different browsers open the Bilibili.com website, the browser prompts that the loading fails;
3. Solve the problem of returning from the desktop to the login interface when executing gitk;
4. Solve the problem of loading MT driver error when GPU hardware is not inserted;
5. Solve the problem of wrong color display or blurry screen when the program window is maximized and switched to the window;
6. Solve the problem that the desktop screen displays a slight jitter under normal use;
7. Solve the problem that the new document page of WPS is not fully displayed, and there is no response when clicking;
8. Solve the problem of freezing when the window moves after switching the desktop resolution;
9. Solve the problem that the system does not respond when the window position is moved when the desktop is set to zoom;
known issues
1. In the multi-screen extension or copy mode, a white screen will appear on the lock screen interface;
2. When the zoom display is set on the desktop, there will be a probability of window freezing when moving the window position;
3. When running the valley Benchmark, the color of the rocks may appear incorrect;
4. Other known issues;
installation steps
1. Download the driver program through the Moore thread official website, execute the command sudo dpkg -i musa_2.1.0-Ubuntu_amd64.deb after the installation is complete and restart to complete the installation;

Loeschzwerg

2023-08-25, 07:41:42

Größerer Versionssprung beim MTT Treiber, jetzt mit offiziellem DX11 Support:
https://videocardz.com/newz/moore-threads-gpu-driver-now-officially-supports-directx11

New Features

Support for Windows DirectX 11.
DisplayPort Multi-Stream Transport (MST) functionality.
Display Stream Compression (DSC) functionality, capable of achieving a 144Hz refresh rate at 3840×2160 resolution.
Significant improvement in driver efficiency and stability.
PES Control Center uninstall driver and restart function, optimizing the PES Control Center installation process.
PES Control Center game library feature.
PES Control Center automatic detection of Resizable BAR status.

New Game Support

“Genshin Impact”
“Dota 2”
“Street Fighter V”
“Call of Duty 4: Modern Warfare”
“Call of Duty: Modern Warfare 3”
“Euro Truck Simulator 2”
“Command & Conquer: Red Alert – Remastered”
“Command & Conquer: Tiberian Dawn – Remastered”
“Stellaris”
“Human: Fall Flat”
“Cities: Skylines”
“Football Manager 2023”
“BioShock 2: Remastered”
“Subnautica: Dave’s Journey”
“BattleBit Remastered”

Loeschzwerg

2023-11-07, 12:30:21

ImgTec hat die DXD Grafiklösung vorgestellt:
https://www.imaginationtech.com/products/gpu/img-dxd-gpu/

IMG DXD is the first product in a new line of high-performance GPU IP with support for DirectX*. Starting with DirectX Feature Level 11_0, IMG DXD is designed for cloud gaming and desktop graphics experiences, with API coverage to run popular PC games and Windows-based applications.

FL11_0 klingt jetzt zwar nicht sonderlich spannend, aber vielleicht kündigen sich allgemein wieder mehr Desktop-Lösungen mit PowerVR-Innereien an. Immerhin spricht ImgTec auf Twitter dass es bereits Lizenznehmer gibt.

Edit:
https://blog.imaginationtech.com/img-dxd-a-new-horizon-for-cloud-gaming

Edit2:
Zum Thema Cloud-Gaming gibt es ein kleines Marketing-Video was die Innosilicon Fantasy I Lösung auf Basis BXT zeigt:
LWmd8YB537o

Ailuros

2023-11-08, 05:15:56

Klingt schon fast so als ob man versucht Kaffee von einem Automaten zu holen und der Automat laesst zuerst den Kaffee ab und danach den Becher dafuer. :freak:

IMG wollte vor Albiorix fuer China in den dGPU Markt mit ihrem IP eindringen. Fuer solch eine Aenderung liefert man gefaelligst anstaendige windows Treiber von Anfang an mit BXT.

Loeschzwerg

2023-11-08, 07:25:18

Tja, war leider nicht der Fall. Kann letztendlich nur besser werden :D Die Treiber für die MTT Karten sind zumindest immer noch ziemlich schlecht, aber DX11 wird so langsam. OpenGL/CL und VLK fehlen unter Windows noch komplett.

mboeller

2023-11-09, 13:48:35

https://www.design-reuse.com/news/55176/ventana-imagination-risc-v-cpu-gpu.html

diese Ankündigung wundert mich ein wenig.

IMG wollte ja auch selbst RISC-V CPUs auf den Markt bringen, aber bisher gab es außer schon älteren Ankündigungen nichts neues, soweit ich weiß.

Ist das RISC-V Schiff von IMG am sinken, oder schon gesunken? Oder interpretiere ich zu viel in das nicht Vorhandensein von News

Ailuros

2023-11-10, 12:33:14

https://www.design-reuse.com/news/55176/ventana-imagination-risc-v-cpu-gpu.html

diese Ankündigung wundert mich ein wenig.

IMG wollte ja auch selbst RISC-V CPUs auf den Markt bringen, aber bisher gab es außer schon älteren Ankündigungen nichts neues, soweit ich weiß.

Ist das RISC-V Schiff von IMG am sinken, oder schon gesunken? Oder interpretiere ich zu viel in das nicht Vorhandensein von News

Entwicklung ist in den letzten Jahren im Schneckentempo bei IMG. Bis jetzt haben wir eine einzige (low end) RISC V CPU IP Variante von IMG.

Hat aber wohl im obrigen Fall nichts damit zu tun, da Ventana (ich musste selber suchen fuer was die Firma steht...) einfach nur GPU IP von IMG lizenziert hat.

Tja, war leider nicht der Fall. Kann letztendlich nur besser werden :D Die Treiber für die MTT Karten sind zumindest immer noch ziemlich schlecht, aber DX11 wird so langsam. OpenGL/CL und VLK fehlen unter Windows noch komplett.

Na dann will ich hoffen dass die meisten Wehwechen dann weg sind bei der dritten an der Reihe dGPU IP Generation und dass zumindest endlich das wesentlichste anstaendig unterstuetzt wird. Eben wie oben...Schneckentempo.

mboeller

2023-11-14, 13:57:20

Entwicklung ist in den letzten Jahren im Schneckentempo bei IMG. Bis jetzt haben wir eine einzige (low end) RISC V CPU IP Variante von IMG.

Ja, sehe ich auch so. Aber vielleicht erwarten wir einfach zu viel von einer so kleinen Firma.

Ich habe mir mal ihren letzten Report von Ende '22 durchgelesen. 120Mio Umsatz + 559 Mitarbeiter sind halt doch sehr klein. AMD, auch eine Art IP-Firma (ohne eigene Fertigung) hat ca. 25T Mitarbeiter und 23.6 Mrd Umsatz ... dagegen ist IMG weniger als ein Rundungsfehler. Ja, ein wenig hart, aber es ist halt so. Entsprechend dauert alles ein wenig länger.

Loeschzwerg

2023-11-14, 14:20:35

Hinsichtlich Software/Treiber wäre es dann umso wichtiger OpenSource zu gehen.

Ailuros

2023-11-17, 10:58:20

Ja, sehe ich auch so. Aber vielleicht erwarten wir einfach zu viel von einer so kleinen Firma.

Ich habe mir mal ihren letzten Report von Ende '22 durchgelesen. 120Mio Umsatz + 559 Mitarbeiter sind halt doch sehr klein. AMD, auch eine Art IP-Firma (ohne eigene Fertigung) hat ca. 25T Mitarbeiter und 23.6 Mrd Umsatz ... dagegen ist IMG weniger als ein Rundungsfehler. Ja, ein wenig hart, aber es ist halt so. Entsprechend dauert alles ein wenig länger.

AMD ist keineswegs eine IP Firma; dass sie in letzten Jahren etwas IP verkaufen heisst eben nicht dass IP in irgend einer Art ihr Kerngeschaeft ist.

Sonst gibt es fuer fehlende windows Treiber keine wirkliche Entschuldigungen; erstens braucht man dafuer eben nicht eine Unmenge von sw engineers und zweitens wahren diese schon zu Zeiten wo Intel windows Treiber brauchte - etliche Jahre her faellig. Nach IMG selber haben sie diese nachgeliefert, aber Intel wollte sie dann nicht mehr haben.

Entweder wurden damals nie anstaendige windows Treiber entwickelt, oder das obrige stimmt und kein Schwein hatte den Einblick die existierenden Treiber durch die Jahre weiterzupflegen und dafuer braeuchten sie auch nicht mehr als eine handvoll sw engineers die parallel auch anderes bearbeiten koennen. Frag doch Loeschzwerg wie heute die GPU windows Treiber von allem ex S3 aussehen im Vergleich zu IMG....

Sonst hat IMG weltweit eigentlich 1050 Angestellte seit 2022, ausser sie haben in der Zwischenzeit eine grosse Menge wieder entlassen: https://www.imaginationtech.com/news/imagination-announces-ambitious-global-recruitment-drive/

Ich kann mich noch erinnern bevor ein alter Bekannte@B3D vor Jahren bei IMG angefangen hat, dass ihr shader compiler wirklich der letzte Mist war und die Firma sogar eine dritte Firma fuer diesen einstellte. Als der Bekannte den compiler uebernahm hatte damals Apple ca. jede 2 Monate eine Leistungssteigerung von ~20% JEDES Mal, weil eben der Kerl es schaffte den ganzen Saustall aufzuraeumen.

IMG ist eher voll mit Kerlen die sich auf ihren uralten beschissenen TILE BASED DEFERRED RENDERER Lorbeeren ausruhen und zu bloed sind sich dem jeglichen Fortschritt der Konkurrenz anzupassen. Es sind dann eben solche Klugscheisser schuld dass Kerle wie der oben erwaehnte und viele andere wie Rys oder auch Andrej nicht allzu lange bei IMG geblieben sind. Ja warum wohl?

Vor Albiorix drehte den IMG marketing Kerlen ein potentieller Kunde unter die Nase dass QCOM eine verdammt hoehere GFLOP/mm2 Rate hat in ihren Adreno GPUs und kein Schwein bei IMG hat es mitbekommen. Kein Wunder dass ihnen Apple den Mittelfinger zeigte und die GPU ALUs im IMG IP von Null auf wieder entwickelte damals. Dann wurde natuerlich Albiorix entwickelt von 32 zu 128 lanes/SIMD; too little too late. Wie viele high end smartphones gibt es denn heute mit IMG GPU IP von dem sie auch als Firma royalties kassieren?

Loeschzwerg

2023-11-21, 08:43:46

Neuer MTT Treiber v240.50:
https://developer.mthreads.com/driver-info/MTT_S80/release-note/v240.50?osv=WINDOWS_10&pn=MTT_S80

Moore Thread Software: MTT S Series Windows Desktop Driver: PES Control Center 240.50
Driver version: v240.50
Release time: November 20, 2023

Release Notes

new features
1. Support OpenGL 3.3 API under Windows 10 operating system;

Performance and experience optimization
1. The average frame rate of "PUBG" has increased by more than 80% compared to the v230.40 version;
2. The average frame rate of "Fearless Contract" has increased by more than 60% compared to the v230.40 version;
3. The average frame rate of GTA5 has increased by more than 60% compared to the v230.40 version;
4. The average frame rate of Assetto Corsa has increased by more than 50% compared to version v230.40;
5. The average frame rate of "Far Cry: New Dawn" has increased by more than 30% compared to the v230.40 version;
6. Optimization of the game experience of "Ark of Destiny";
7. "Crystal Core" game experience optimization;
8. "Rocky" game experience optimization;
9. "Dragon Nest" game experience optimization;
10. "Dyson Sphere Project" game experience optimization;
11. "Farm Simulator 19" game experience optimization;
12. Optimization of the game experience of Assetto Corsa;
13. "Strange RPG" game experience optimization;
14. "The Sims 4" game experience optimization;
15. "Tropico Tycoon 5" game experience optimization;
16. "Asphalt 9: Racing Legend" game experience optimization;
17. "Need for Speed: Most Wanted" game experience optimization;
18. "Urban Transport 2" game experience optimization;
19. "Floating City" game experience optimization;
20. Optimize the game experience of "Sea of Stars";
21. "Dungeon and Fighter" game experience optimization;
22. "Fearless Contract" game (Riot platform) experience optimization;
23. "Beast Party" game experience optimization;

Supported graphics card models
1. MTT S80
2. MTT S70

Supported operating systems
1. Support Windows10 64bit 21H2 Professional Workstation Edition and subsequent versions

Known limitations
1. Above 4G and Resizable B.A.R. functions need to be enabled in the motherboard BIOS (different brands of motherboards may have different corresponding function names);
2. On some motherboards that do not support PCIe Gen5, the PCIe speed needs to be set from auto to PCIe Gen4 speed;

Issue fixed
1. Solve the problem that when running "Rocky Heroes" to enter the character login interface and slide the mouse to the lower right corner of the interface, the screen will be blurred;
2. Solve the problem that the grass scene of the game is drawn incorrectly when running "Beast Party" at extremely high image quality;
3. Solve the problem of probabilistic game crash when the PES control center floating window is mounted when running Dota2 and the resolution is switched;
4. Solve the problem of crashing after entering the game when running "Aliens vs. Predator";
5. Solve the problem of abnormal display on the main interface of the game when running "Asphalt 9: Racing Legends";
6. Solve the problem of crashing when running "Counter-Strike Online" into the game;
7. Solve the problem of unstable frame rate when running the game "Counter-Strike Online";
8. Solve the problem of incorrectly painted track walls when running the Assetto Corsa game;
9. Solve the problem of the program being unresponsive for a long time after running a specific Windows OpenGL program and going to sleep and then waking up, or after entering the system lock screen and then unlocking it;
10. Solve the problem of probabilistic lag when running Windows OpenGL program in multi-screen extended mode;
11. Solve the problem of probabilistic drawing errors when running Heaven or Valley using the Windows OpenGL option;
12. Solve the problem that when a Windows user with ordinary permissions installs the PES control center, the Resizable BAR detection fails and the driver cannot be installed due to a probability prompt;
13. Solve the problem that when running "Movies and TV" to play 7680 x 4320 resolution video, after manually entering sleep or waking up from hibernation, "Movies and TV" may not be able to use GPU hardware decoding and the app will crash when switching to the next video;
14. Solve the problem of probabilistic video jitter after entering sleep and waking up when running "Movies and TV" to play 7680 x 4320 resolution video;
15. Solve the problem that when running "Movies and TV" to play 7680 x 4320 resolution video, the same monitor is connected to two different display data cables (HDMI and Display Port), and the two data cables are continuously plugged in and out, "Movies and TV" may Problem with sexual prompts not playing;
16. Solve the problem that after running "Movies and TV", KMPlayer, WMP, and Tencent Video at the same time, and continuously plugging and unplugging the Display Port data cable, the system may have a blue screen;
17. Solve the problem of the video player crashing or drawing errors when running two Heaven programs and two Valley programs at the same time and playing 4 channels of 3860 x 2160 30Hz videos under a stress test;
18. Solve the problem of probabilistic GPU drawing errors when running Heaven 3840 x 2160 resolution window mode;
19. Solve the problem that when running Furmark, the image flickers or the image fails to adapt to the window when dragging the window;
20. Solve the problem that when VLC and Potplayer are used to play 7680 x 4320 resolution videos at the same time, Potplay will probabilistically blur the screen and freeze after waking up from system sleep and hibernation;
21. Solve the problem of uninstalling the (device) GPU driver from the system driver property page, which may cause a system blue screen;
22. Solve the problem that when opening the homepage of "Thunder Simulator 5", the program border is drawn incorrectly;
23. Solve the problem that when running "Master Lu" for performance evaluation, the test score range may fluctuate too much;
24. Solve the problem of black screen probability when running "Yuanqi Desktop" and using the computer theme function;
25. Solve the problem that when running "Tencent Conference" in the dual-screen extended mode, select the shared screen, check Portrait Picture-in-Picture, and click to confirm sharing, the program may freeze;
26. Solve the problem that when running "Tencent Meeting" in the dual-screen extended mode and selecting remote control, the controlled computer will display a black screen probabilistically;
27. Solve the problem of a green screen appearing at the bottom of some videos when running Edge or Chrome browser to play Youku videos;
28. Solve the problem where the display cannot light up after installing the PES control center, unplugging the Display Port data cable after entering system sleep, and plugging in the Display Port data cable after waking up the system;
29. Solve the problem of no prompt after the PES control center fails to obtain system administrator rights;
30. Solve the problem that when running the PES control center floating window and the Valley program at the same time (the phenomenon is the same as other DirectX programs), Valley probabilistically prompts an unknown error;
31. Solve the problem that GPU hard decoding cannot be used when running KMPlayer to play 10bit videos;

Known issues
1. The size of the interior rearview mirror in the game "Need for Speed: Hot Pursuit" is probabilistically rendered abnormally;
2. During the process of overwriting or silently upgrading the PES Control Center as a Windows user with normal rights, if the first step is to uninstall the PES Control Center and then restart it, the interface for installing the new version of the PES Control Center in the second step will not pop up;

Endlich wird OpenGL (wenn auch 3.3) unterstützt, das muss ich mir natürlich zeitnah anschauen :)

Loeschzwerg

2023-11-21, 17:49:50

Hier der OpenGL Report zum neuen Treiber:
http://opengl.gpuinfo.org/displayreport.php?id=11166

mboeller

2023-11-22, 15:54:20

die neuen Treiber funktionieren also auch bei der MTT S30 und nicht nur bei der S70 und S80 wie es im Text steht?
Oder hat das "GL_RENDERER Moore Threads MTT S30" nichts mit der GPU zu tun?

Sind die Treiber wirklich so massiv besser, wie es im Text steht?

Loeschzwerg

2023-11-22, 17:51:53

Die Treiber funktionieren mit sämtlichen Modellen von Desktop bis Server. S10, S30, S50, S70, S80... Die IDs sind auch alle in der Treiber-inf enthalten. Ich habe aktuell meine S30 verbaut und damit den OpenGL-Check gemacht.
Ob die Leistungssteigerungen alle so zutreffen kann ich nicht sagen, ich habe irgendwie keines der genannten Spiele :freak: Wobei, ich könnte die Assetto Corsa Demo installieren.

Ganz sauber arbeitet der Treiber zumindest nicht, der 3DMark11 stürzt jetzt wieder reproduzierbar ab. Ich muss allerdings dazusagen dass da jetzt ein anderer Monitor dranhängt und das kann durchaus zu Problemen führen (Ja, ist echt so!) d.h. hier muss ich erst noch einen Gegentest mit dem alten machen.

Raff

2023-12-13, 22:19:38

Warum versteckt Moore Threads die Treiber-Downloads eigentlich so gut? Ist das Scham, Absicht ... oder nur meine schwachen Mandarin-Skills? :biggrin:

Mal sehen, ob meine Anmeldung jemals mit einer Antwort-Mail kommentiert wird. Falls nein, könnte bitte jemand den aktuellen Treiber irgendwo uppen? Löschzwerg, konkretor, ihr seid doch hier die Spezis. :up:

MfG
Raff

DrFreaK666

2023-12-14, 05:13:43

Hab ich was verpasst? Ist MTT der Nachfolger von Power VR oder wieso hat das keinen eigenen Thread?

DrFreaK666

2023-12-14, 05:16:22

Hier gehören doch eher diese GPUs rein (die wahrscheinlich erwähnt wurden)
https://www.techpowerup.com/309010/imagination-technologies-launches-the-img-cxm-gpu

Loeschzwerg

2023-12-14, 06:38:50

Warum versteckt Moore Threads die Treiber-Downloads eigentlich so gut? Ist das Scham, Absicht ... oder nur meine schwachen Mandarin-Skills? :biggrin:

Die Seite ist wirklich extrem gut versteckt, da musste ich auch erst etwas suchen. Egal, hier der Link: https://developer.mthreads.com/driver

Eine Anmeldung ist dafür nicht notwendig :)

Tipp hinsichtlich dem Treiber selbst: Im PES (das Control Menü) kannst du, leider ebenfalls etwas versteckt, einen Haken für Community Veröffentlichungen (Beta Release) setzen. Das PES bietet dir dann im Home Bildschirm (ganz oben wo die Version steht) die Möglichkeit für einen Update an, sofern verfügbar. Diese "Beta Treiber" gibt es nur über diesen Weg.

Hab ich was verpasst? Ist MTT der Nachfolger von Power VR oder wieso hat das keinen eigenen Thread?

Die MUSA Architektur von MTT basiert auf PowerVR IP. Sehr wahrscheinlich B Series. MTT ist also kein Nachfolger, aber ein Lizenznehmer :)

mboeller

2023-12-14, 07:30:48

Warum versteckt Moore Threads die Treiber-Downloads eigentlich so gut? Ist das Scham, Absicht ... oder nur meine schwachen Mandarin-Skills? :biggrin:

Mal sehen, ob meine Anmeldung jemals mit einer Antwort-Mail kommentiert wird. Falls nein, könnte bitte jemand den aktuellen Treiber irgendwo uppen? Löschzwerg, konkretor, ihr seid doch hier die Spezis. :up:

MfG
Raff

???

https://www.mthreads.com/news (einfach in englisch übersetzen lassen)

zumindest in den News wurden die neuen Treiber sofort erwähnt:
https://www.mthreads.com/news/141

Weiter habe ich aber nicht geschaut gehabt.

Loeschzwerg

2023-12-14, 07:43:56

zumindest in den News wurden die neuen Treiber sofort erwähnt:
https://www.mthreads.com/news/141

Aber einen Link zum Download sucht man vergebens ^^

Man muss wirklich auf diese Seite gehen:
https://www.mthreads.com/driver/pes

Und dort den orangenen Button unter PES anklicken, nur so kommt man dann auf https://developer.mthreads.com/driver. Im Normalfall erwartet man sowas aber irgendwo in der Navigation der Seite.

DrFreaK666

2023-12-14, 08:49:15

...Die MUSA Architektur von MTT basiert auf PowerVR IP. Sehr wahrscheinlich B Series. MTT ist also kein Nachfolger, aber ein Lizenznehmer :)

Dann hab ich tatsächlich was verpasst. Danke für die Info

Loeschzwerg

2023-12-18, 10:31:12

@Raff und all:
MTT hat die Website umgebaut, die Treiber (inkl. Beta Releases!!!) gibt es jetzt hier -> https://www.mthreads.com/pes/drivers/search

DrFreaK666

2023-12-19, 11:20:52

Ist das neu?

Moore Threads Unveils MTT S4000 GPU: Equipped With 48 GB Memory, 200 TOPS AI Compute, Gen5 Ready
https://wccftech.com/moore-threads-mtt-s4000-gpu-48-gb-memory-200-tops-ai-gen5-ready/

Raff

2023-12-19, 12:00:50

@Raff und all:
MTT hat die Website umgebaut, die Treiber (inkl. Beta Releases!!!) gibt es jetzt hier -> https://www.mthreads.com/pes/drivers/search

Danke! =) :up:

Ist das neu?

https://wccftech.com/moore-threads-mtt-s4000-gpu-48-gb-memory-200-tops-ai-gen5-ready/

Jo. Nice. 25 TFLOPS FP32 - die S80 hat nur rund 14 TFLOPS. Und schon wieder riecht das Produkt nach Intel - Battlemage wird laut aktueller Annahme einen ähnlichen Sprung hinlegen.

MfG
Raff

mboeller

2023-12-19, 14:17:09

Danke! =) :up:

Jo. Nice. 25 TFLOPS FP32 - die S80 hat nur rund 14 TFLOPS. Und schon wieder riecht das Produkt nach Intel - Battlemage wird laut aktueller Annahme einen ähnlichen Sprung hinlegen.

MfG
Raff

passiv gekühlt???

The card itself comes in a standard two-slot passive-cooled solution and makes use of a 12VHPWR power connector to boot

Loeschzwerg

2023-12-19, 17:52:10

Jo, ist ja die Variante für Server und keine Desktop-Lösung.

davidzo

2023-12-20, 16:17:08

Ja, richtig 'passiv' ist anders :freak:

Der typische Airflow in einem Rack ist mal locker das Doppelte von einem Gaming-PC, bzw. mal eben zehnfache pro Flächenquerschnitt.

Pi mal Daumen rechnet man heutzutage mit 1KW pro Rackspace Höheneinheit. So eine Höheneinheit braucht wiederum 120 bis 200CFM an Airflow für die Abwärme von 1KW. Die Datenblatt freeflow Werte von Lüftern sind immer ca. das doppelte, also 240 bis 300CFM für 1HE.

Ein typisches 40mm doppellüfteraggregat hat schon 30+CFM, also schon 2/3 der Leistung eines leisen 120mm Casefans. 2HE/80mm Lüfteraggregate haben weit über 100CFM, also mehr als ein highend 120mm PC Fan wie der Phanteks T30, NFA12x25 oder Thoughfan auf Max-RPM.
In aktuellen 1HE Gehäusen sind in der Regel 8 Stück 40mm Aggregate verbaut, in 2HE 4x80mm was sich dann auf 1-2CPUs und 2-4GPUs aufteilt.

Der "Passivkühler" bekommt im Schnitt also mal eben 60CFM, bzw. den Airflow eines Noctua Noctua NF-A12x25 oder den Durchsatz von ca. 2-3x 80mm OEM Slim fan. Das entspricht also eher einer dual oder triple Fan GPU-Kühlung.

Ailuros

2023-12-22, 06:34:57

Jo, ist ja die Variante für Server und keine Desktop-Lösung.

Fuer DXD gibt IMG 2.3 GFLOPs FP32 (womoeglich bei =/>1.1GHz?) an. Weiss der Geier wieviel cores das Tier hat fuer 25 TFLOPs. 8@1.5GHz?

Loeschzwerg

2024-02-20, 16:37:43

Neuer MTT PES Release 250.60 u.a. mit jetzt offizieller MTT S30 Unterstützung (vorherige Treiber gingen aber auch schon) und vielen Verbesserungen hinsichtlich Spielen:
https://www.mthreads.com/pes/drivers/driver-info/DESKTOP_MTT_S80/release-note/v250.60?productType=DESKTOP&osVersion=MTT_S80_WINDOWS_10

Performance and Experience Optimizations
Average frame rate of Progenitor has been improved by more than 35% compared to v240.50;

More than 30% average frame rate improvement over v240.50 for Infernal Fear;

Fearless Pact average frame rate has been improved by more than 25% compared to v240.50;

The average frame rate of Kolossa has been improved by more than 25% compared to v240.50;

Metro 2033 average frame rate has improved by over 20% compared to v240.50;

Street Fighter 5 averaged more than 15 percent higher than the v240.50 version;

Crysis: New Dawn average frame rate improvement of more than 15% vs. v240.50;

Dota 2 average frame rate improved by more than 10% vs. v240.50;

Baldur's Gate 3 gameplay experience optimization.

Optimized game experience for Wipeout: Star Dome Railroad.

Optimized gameplay experience for Crossfire.

Ironclad: Ironclad Warriors gameplay experience optimization.

World of Tanks game experience optimization.

Crysis 3 game experience optimization; Crysis 3 game experience optimization; World of Tanks game experience optimization; Crysis 3 game experience optimization.

Wind Waker game experience optimization.

Shadowrun: Pirates of the Damned gameplay experience optimization.

Ice Age game experience optimization; My Friend Pedro game experience optimization.

My Friend Pedro game experience optimization.

My Friend Pedro; Thief of Thieves

World Rally Championship 8; Optimize the game experience of World Rally Championship 8.

Translated with DeepL.com (free version)

Loeschzwerg

2024-02-29, 17:13:29

Erste Ergebnisse mit dem neuen Treiber gibt es hier: https://www.computerbase.de/forum/threads/moore-threads-sammelthema-u-a-mtt-s80.2128604/page-3#post-29181406

3DMark Fire Strike:
MTT S30 :: Gesamt 1980; Graphics 2050
MTT S80 :: Gesamt 7171; Graphics 7248

DX11 wird so langsam brauchbar, aber scheinbar kann der Treiber immer noch kein Multi-Threading. Zumindest FFXV stürzt weiterhin mit entsprechender Fehlermeldung ab.

mboeller

2024-03-07, 19:41:34

Ich "hijacke" mal den Thread für eine NNA-Info.

Ich habe Informationen über IMG's Series4 NNA gefunden.

https://www.embedded.com/imagination-launches-new-multi-core-low-bandwidth-nna-for-adas/

Die Folie zeigt 30 TOPS/w + 12 TOPS/mm² in 5nm.

Das sind IMHO ziemlich gute Werte.

Loeschzwerg

2024-03-11, 13:39:54

Kurztest der MTT S30 und S80 bei CB mit den jüngsten Treibern:
https://www.computerbase.de/2024-03/moore-threads-mtt-s80-mtt-s30-china-gpus-test/

Besser, aber immer noch weit entfernt von gut/brauchbar.

Ailuros

2024-03-14, 10:15:23

Ich "hijacke" mal den Thread für eine NNA-Info.

Ich habe Informationen über IMG's Series4 NNA gefunden.

https://www.embedded.com/imagination-launches-new-multi-core-low-bandwidth-nna-for-adas/

Die Folie zeigt 30 TOPS/w + 12 TOPS/mm² in 5nm.

Das sind IMHO ziemlich gute Werte.

Der Artikel ist fast 4 Jahre alt. Wenn ich es mit der Info auf deren Hauptseite vergleiche, klingt es eher so als ob sie die meisten Werte schon mit 7nm erreichen, die Einschaetzung fuer 5nm war in 2020 womoeglich ziemlich konservativ oder ich verpasse wesentliches?

https://www.imaginationtech.com/products/ai/img-series4-nna/

A single IMG Series4 core in 7nm can deliver up to 12.5 TOPS per core at 1.2GHz and can be arranged in a cluster of 2, 4, 6, or 8 cores that can be laid down in multiple clusters. An 8-cluster core is 100 TOPS, and six of these on a single SoC would result in 600 TOPS.

Depending on configuration, the IMG Series4 is more than 100 times faster than a GPU for AI acceleration and 1000 times faster than a CPU.

Es sind die gleichen 8 cores die 100 TOPs erreichen, sowohl in 5nm als auch in 7nm. Von 7 auf 5nm kann man locker erstmal eine hypothetische Frequenzsteigerung von =/>25% erwarten.

mboeller

2024-03-14, 12:31:22

Der Artikel ist fast 4 Jahre alt. Wenn ich es mit der Info auf deren Hauptseite vergleiche, klingt es eher so als ob sie die meisten Werte schon mit 7nm erreichen und die Einschaetzung fuer 5nm in 2020 womoeglich ziemlich konservativ war oder ich verpasse wesentliches.

Hallo Ailuros;

sehe ich auch so, aber das ist die einzige Info die ich gefunden habe mit TOPS/w und TOPS/mm2. 100TOPS (soweit ich sehe in 8bit, bin mir aber nicht sicher) in 8mm² und mit ~3Watt. nett.

Ailuros

2024-03-14, 14:43:24

Hallo Ailuros;

sehe ich auch so, aber das ist die einzige Info die ich gefunden habe mit TOPS/w und TOPS/mm2. 100TOPS (soweit ich sehe in 8bit, bin mir aber nicht sicher) in 8mm² und mit ~3Watt. nett.

Ja zu 8bit fuer die TOPs, zum Stromverbrauch *schulterzuck* (keine Ahnung).

Wichtiger ist eher der Teil hier:

The ITT function is a patent-pending technology that addresses bandwidth efficiency by splitting input data tensors into multiple tiles for efficient data processing. ITT exploits local data dependencies to keep intermediate data in on-chip memory. This minimizes data transfers to external memory, reducing bandwidth by up to 90%. ITT is a scalable algorithm with major benefits on networks with large input data sizes.

Imagination said that with ITT, which is patent pending, this brings in reduced bandwidth requirements, providing the ability to split the networks and run them on the selected cores and enabling really fine-grained control over the workload.

The outcome of these architectural features is ultra-high performance and ultra-low latency, according to Imagination. The low-power NNA architecture is designed to run full network inferencing while meeting functional safety requirements. It executes multiple operations in a single pass to maximize performance per watt and deliver industry-leading energy efficiency.

Liesst man den Text vorsichtig durch kann man sich vielleicht vorstellen warum IMG in ihrem Marketing konstant ihre ALUs als superskalar bezeichnet.

IMHO werden in absehbarer Zukunft solche SoC Bloecke ueberfluessig, wenn GPUs stark genug werden. Wichtig ist dann eben dass eine solche GPU dann auch gleichzeitig und mit maximalen Werten alle Praezisions-Kanaele bedienen kann. Ist aber auch nichts ausschliessliches fuer IMG.

Ailuros

2024-04-08, 10:03:30

https://www.imaginationtech.com/news/new-catapult-cpu-is-driving-risc-v-device-adoption/

https://www.imaginationtech.com/products/cpu/apxm-6200/

64bit, in order, 11 stage, dual issue mainstream RISC V CPU IP

mboeller

2024-04-08, 11:30:38

https://www.imaginationtech.com/news/new-catapult-cpu-is-driving-risc-v-device-adoption/

https://www.imaginationtech.com/products/cpu/apxm-6200/

64bit, in order, 11 stage, dual issue mainstream RISC V CPU IP

Wenn die Balken im Video korrekt sind (big if) dann wäre ihre CPU ca. 28% schneller als ein Cortex A-510 und damit fast/gleich schnell wie ein etwas älterer Cortex A-7x Kern. Jetzt müssten wir nur noch wissen wie viel die neue CPU säuft ;)

Raff

2024-06-18, 22:49:30

Es gibt übrigens wieder einen neuen Treiber für die MTT-Grafikkarten: https://www.mthreads.com/pes/drivers/driver-info/DESKTOP_MTT_S80/release-note/v260.70?productType=DESKTOP&osVersion=MTT_S80_WINDOWS_10

MooreThreads Software: MTT S Series Windows Desktop Driver: PES Control Center 260.70
Driver version: v260.70
Release time: 2024-05-30
new features
Provide support for OpenGL 4.0 API under Windows 10 operating system;

Performance and experience optimization
The average frame rate of GTA5 has increased by more than 55% compared to version v250.60;

The average frame rate of League of Legends has increased by more than 40% compared to version v250.60;

The average frame rate of Final Fantasy 14 has increased by more than 20% compared to version v250.60;

The average frame rate of It Takes Two has increased by more than 30% compared to v250.60;

NBA2K OL2's average frame rate has increased by more than 20% compared to version v250.60;

The average frame rate of Destiny Ark (Wegame) has increased by more than 10% compared to version v250.60;

"Baldur's Gate 3" game experience optimization;

"World of Warcraft" game experience optimization;

"The Legend of the Condor Heroes" game experience optimization;

The game experience of "Tomb Raider: Shadow" has been optimized;

"Civilization 6" game experience optimization;

"Euro Truck Simulator 2" game experience optimization;

The game experience of Shadow Conspiracy: Cursed Pirates has been optimized.

"Devil May Cry 4" game experience optimization;

Blender 3.6 LTS experience optimization;

Supported graphics card models
MTT S80

MTT S70

Supported operating systems
Support Windows 10 64bit 21H2 Professional Workstation Edition and subsequent versions

Known limitations
You need to enable the Above 4G and Resizable BAR functions in the motherboard BIOS (the corresponding function names may be different for different brands of motherboards);

On some motherboards that do not support PCIe Gen5, you need to set the PCIe rate from auto to PCIe Gen4 rate;

Fixed Issues
Solved the problem of abnormal display of character heads in GTA5 game;

Solve the problem of basketball shadow display error and frame rate drop in NBA2K Online2 game;

Solved the problem of probabilistic game crash when creating a new game in Dyson Sphere Program;

Solve the problem of occasional screen flickering when running the game "Tomb Raider: Shadow";

Solved the problem of the game crashing when the anti-aliasing setting is set to extremely high when running the game "Crystal Core";

Solve the problem of low frame rate when running the game "Destiny Ark";

Solved the problem of the game becoming unresponsive when running the game It Takes Two;

Solve the problem that when running "League of Legends" and clicking the home page activity, the game will have a black screen or no response;

Solved the problem of the game crashing when running the game "Genshin Impact";

Solved the problem of the game crashing when using the ALT+TAB keys to switch back to the desktop when running the game "Sekiro: Shadows Die Twice";

Solved the problem of body equipment flickering when the character moves when running the game "The Last Era";

Solve the problem of occasional flashback during the operation of "CAD Mini Viewer" software;

Solve the problem of occasional freezing or crash when running Blender3.6 LTS software;

Solve the problem of software occasionally becoming unresponsive when running "Jianying";

Solve the problem of software crashing occasionally when running Douyu live broadcast room;

Solve the problem that the software may become unresponsive after loading a model in 3ds Max

Resolved issues with software crashes and occasional rendering errors when running 3DMark FireStrike Ultra;

Addressed the issue where display 1 may display distorted screen when switching display mode to "Second screen only" when displaying via DisplayPort Multi-Stream Transport (MST);

Resolved the issue of no signal output or blue screen when performing a restart stress test via DisplayPort Multi-Stream Transport (MST) display;

Solved the problem of video screen jitter when playing videos in full screen in Windows HD Color settings and switching on and off "Stream HDR Video";

Solve the problem that when using the DisplayPort interface to connect the ViewSonic VX2719-2KP-HD monitor, setting the resolution to 2560 x 1440 144hz and turning on the HDR setting, the monitor may have no signal output;

Solved the problem that when recording the screen using the PES Control Center recording function, the icon in the lower right corner of the PES Control Center may become abnormal after running the game or program for a long time;

Solve the problem of jitter and green screen when playing videos with different resolution combinations and multiple players at the same time, and when the system is dormant or awakened from sleep mode;

Known Issues
When some software queries the driver OpenGL version, it may display OpenGL 3.3 version;

There are probabilistic rendering errors in plants in World Rally Championship 8;

After opening the PES Control Center, switching between administrator and ordinary user will cause the PES Control Center to crash occasionally.

When the system's built-in browser plays a website video, there is a low probability that the screen will not respond;

When playing videos with KMPlayer, after the system enters sleep mode and wakes up, KMPlayer may crash occasionally.

MfG
Raff

Raff

2024-06-20, 13:56:48

Uuund noch einer: https://www.mthreads.com/pes/drivers/driver-info/DESKTOP_MTT_S80/release-note/v260.70.1?productType=DESKTOP&osVersion=Windows%2011

Erstmals wird auch explizit Windows 11 genannt. Die Chinesen sind echt auf zack. :ulol:

MooreThreads Software: MTT S Series Windows Desktop Driver: PES Control Center 260.70.1
Driver version: v260.70.1
Release time: 2024-06-20
new features
Support Windows 11 64bit 23H2 Professional Edition;

The multi-screen display setting experience of the PES control center is optimized, and the interactive UI and operation logic are updated;

The screen recording function of the PES control center is open to custom settings, allowing users to customize the recording resolution, frame rate and bit rate, and adding a function to calculate the maximum allowed recording time based on the current storage space;

Performance and experience optimization
The average frame rate of the game "Ming Chao" has increased by more than 125% compared to version v250.60.1;

The game experience of "Whitethorn Corridor" has been optimized;

The game experience of "World of Tarris" has been optimized;

"Fallout 76" game experience optimization;

Game experience optimization of "Living Hero"

Supported graphics card models
MTT S80

MTT S70

Supported operating systems
Support Windows 11 64bit 23H2 Professional Edition

Support Windows 10 64bit 21H2 Professional Workstation Edition and subsequent versions

Known limitations
You need to enable the Above 4G and Resizable BAR functions in the motherboard BIOS (the corresponding function names may be different for different brands of motherboards).

On some motherboards that do not support PCIe Gen5, you need to set the PCIe speed from auto to PCIe Gen4 speed.

Fixed Issues
Solve the problem of abnormal display of probabilistic screen lighting effects when running the "Monster Hunter" game;

Solved the problem of the probability prompt "crashed, about to close" when running and opening the "Ming Chao" game;

MfG
Raff

Loeschzwerg

2024-06-20, 14:03:28

Gut dass ich noch nix mit dem 260.70 getestet habe, dann gehe ich jetzt gleich auf Win11 mit dem 260.70.1 (ich hoffe da ist OGL4.0 ebenfalls dabei).

Raff

2024-06-20, 14:13:54

Ich fange nächste Woche auch endlich "richtig" an - stell dich schon mal auf Spam ein. :D

€dit: Kein OpenGL-4-Support mit dem neuen Treiber, ist bei 3.3 plus diverse Erweiterungen. Heieiei, es läuft wirklich fast gar nichts ...

MfG
Raff

Loeschzwerg

2024-06-21, 10:12:22

Jo, Spam mich ruhig zu ^^

€dit: Kein OpenGL-4-Support mit dem neuen Treiber, ist bei 3.3 plus diverse Erweiterungen. Heieiei, es läuft wirklich fast gar nichts ...

Ach komm schon... wenigstens das hätte man vom 260.70 doch gleich mitnehmen können. Was zum Teufel machen die denn?! Aber gut zu wissen, dann nehme ich eine andere SSD für Win11.

Loeschzwerg

2024-07-17, 11:56:04

Machen wir mal Werbung für den guten Raff ^^

1yJ9VMV9v1w

mboeller

2024-08-04, 20:31:53

https://www.imaginationtech.com/news/fortress-investment/

Imagination Technologies (“Imagination”) today announced a new investment by funds managed by affiliates of Fortress Investment Group LLC (“Fortress”). Under the terms of the agreement, Fortress has provided Imagination with a $100 million convertible term loan to support the continued development and growth of technologies and intellectual property (IP) solutions that will help power advances across Graphics, Compute and AI at the edge.

... es geht also weiter (meine Interpretation)

Fortress Investment Group gehört seit Mai zu 70% Mubadala

Raff

2024-08-05, 10:33:51

Machen wir mal Werbung für den guten Raff ^^

https://youtu.be/1yJ9VMV9v1w

:up: =)

Es geht munter weiter, hier der nächste "Happen":

Moore Threads MTT S80 Benchmarks: Leistungsvergleich der China-GPU mit 150 Grafikkarten (https://www.pcgameshardware.de/Grafikkarten-Grafikkarte-97980/Specials/Moore-Threads-MTT-S80-Benchmark-Test-3DMark-Score-1452773/)

MfG
Raff

Tiberius

2024-08-06, 21:10:39

8763 Fire Strike GPU Punkte, grob im Spielfeld von Tahiti (HD 7970/280). Allerdings liegt sie damit noch weit hinter jeder aktuellen Konkurrenz, selbst einer RX 6400 mit 11850 Punkten.

Die meisten Karten könnte man mit dem richtigen Preis irgendwie in den Markt drücken. Wie Raffael im Video beschreibt, verbraucht diese aber schon beim Nichtstun mehr als sie in dieser Leistungsklasse unter Last ziehen dürfte. Das ist selbst für sehr wenig Geld kaum zu vermitteln. In diesem Zustand eher ein Objekt für Sammler und Bastler.

Anerkennung an Raff und seine Kollegen, dass sie sich Zeit nehmen für Themen so weit abseits des Hardware-Mainstream! Auch wenn sie im Einzelnen weniger Besucher einbringen als das hundertste Review einer GeForce-Karte, sind diese Spezialartikel Alleinstellungsmerkmale für PCGH und damit die Zeit und Mühe wert.

Loeschzwerg

2024-08-07, 13:40:30

In diesem Zustand eher ein Objekt für Sammler und Bastler.

Ja, ist so. Man lernt dadurch auch wieder ein wenig die Treiberqualität von AMD/NV zu schätzen ^^
Aber ich muss gestehen, selbst die S3 Graphics Treiber oder auch Glenfly Treiber sind besser als was MTT abliefert. Zumindest mit Blick auf den eigentlichen Treiber und nicht die GUI.

Anerkennung an Raff und seine Kollegen, dass sie sich Zeit nehmen für Themen so weit abseits des Hardware-Mainstream! Auch wenn sie im Einzelnen weniger Besucher einbringen als das hundertste Review einer GeForce-Karte, sind diese Spezialartikel Alleinstellungsmerkmale für PCGH und damit die Zeit und Mühe wert.

Absolute Zustimmung! Gerne auch mehr Nischen wie z.B. Low-Profile, Low-Power oder auch Gaming auf Prof.-Grafikarten.

Ailuros

2024-08-21, 15:28:44

Ja, ist so. Man lernt dadurch auch wieder ein wenig die Treiberqualität von AMD/NV zu schätzen ^^
Aber ich muss gestehen, selbst die S3 Graphics Treiber oder auch Glenfly Treiber sind besser als was MTT abliefert. Zumindest mit Blick auf den eigentlichen Treiber und nicht die GUI.

Fuer welches aber auch selbst IMG nicht unschuldig ist; ich kann mir eben nicht vorstellen dass IMG irgend einen tollen windows Referenz Treiber ausliefert und MTT oder sonst jemand resources verschwendet diesen absichtlich so miserabel zu gestalten....

Loeschzwerg

2024-08-25, 08:47:46

MTT hat wieder einen neuen Treiber für Win11/10 rausgebracht, v270.80 (2024-08-20):
https://www.mthreads.com/pes/drivers/driver-info/DESKTOP_MTT_S80/release-note/v270.80?productType=DESKTOP&osVersion=Windows%2011

What's New
1. OpenGL 4.1 API support for Windows 10 and Windows 11.
2. Support for AV1 format encoding
3. Support for VC1 format decoding

Performance and experience optimizations
1. Average frame rate improvement of over 150% for Chained Together;
2. Pay Day 3 average frame rate increase of over 100%;
3. DOTA 2 average frame rate increase of over 20%;
4. Average frame rate increase of more than 15% for Wuthering Waves;
5. World of Warcraft average frame rate increase of over 15%;
6. Over 15% average frame rate improvement for Overwatch 2;
7. Optimize the game experience of Sekiro: Shadows die twice, Genshin Impact, Zenless Zone Zero, Grand Theft Auto V, 射雕, Final Fantasy 14: Dawntrail, World Rally Championship 8, The Crew 2, Three Kingdoms 2, Need for Speed: Hot Pursuit, JX Online 3, Shadow Gambit The Cursed Crew, Euro Truck Simulator 2, Crystal of Atlan

Ailuros

2024-08-26, 14:00:04

OT zum obrigen:

https://www.eetimes.com/imagination-raises-100-million-investment-to-take-on-edge-ai/

“The China market has been a bit more challenging than we’d have thought, because of the export control regime here in the U.K. and also the entity list in China that has had an impact on us and our revenues,” Imagination CEO Simon Beresford-Wylie told EE Times in an exclusive interview. “The consequence was some downsizing we did last year to get costs in sync with revenue.”

Pffff.....ich will ehrlich nicht wissen wo sie gespart haben.

China represented a third of Imagination’s business in 2019, then-CEO Ron Black told EE Times at the time. Alongside a more difficult regulatory environment, China’s Covid-19 response had an impact on the market there, and Chinese customers went into “cash preservation mode,” Beresford-Wylie said. A combination of these factors meant Imagination lost some of its key Chinese customers in the data center and desktop segments. This led to flat revenues, Beresford-Wylie said, which in turn led to a 30% decrease in Imagination’s headcount at the end of 2023—a move he described as “painful.”

Ach die Tatsache dass IMG beschissene Unterstuetzung fuer die verkaufte IP lieferte hat nichts mit dem obrigen zu tun? So oder so mit 30% weniger Personal hab ich keine weitere Fragen zum Thema Treiber.

Loeschzwerg

2024-08-26, 18:25:23

Puhh... ist schonmal wieder geil, die MTT Treiber (S30 und S80) wollen irgendwie so gar nicht mit Win11 24H2 zusammenarbeiten oder mein bewährtes Testsystem spinnt (wobei die Arise 1020 darauf eben noch lief).
Jo, dann halt erstmal Win11 23H2 installieren :freak:

Loeschzwerg

2024-08-29, 09:59:58

Neue Beta Treiber (v270.80.0.1; 2024-08-28) Release, speziell mit Fixes für "Black Myth: Wukong":
https://www.mthreads.com/pes/drivers/driver-info/DESKTOP_MTT_S80/release-note/v270.80.0.1%20beta?productType=DESKTOP&osVersion=Windows%2011

Optimized performance and experience
1. Average frame rate increase of over 110% for Black Myth: Wukong;

2. Solve the problem of flashing back at the game opening animation when running the game Black Myth: Wukong;

3. Solve the problem that the game does not respond when running Black Myth: Wukong and setting customized settings in the game settings interface;

Loeschzwerg

2024-08-29, 13:02:51

ixbt hat einen aktuellen Test zur MTT S70/S80 gebracht, inkl. Vergleich zu einem älteren Treiber: https://www.ixbt.com/3dv/moore-threads-mtt-s80-s70-review-2024.html (Deepl und Co. helfen)

Tja, was soll man sagen :freak:

hikimiru

2024-08-29, 22:40:40

You can download some SDK and programming guide for Moore Threads. Website needs registration, but you can fill just fake data, like even phone number can be "abc".
https://developer.mthreads.com/sdk/download/musa?equipment=&os=&driverVersion=&version=

Unfortunately I am unable to download SDK. Every time i'm trying downloading is interrupted on 100+ or 300+ MB. Propably because I'm using mobile internet.

From MUSA Programming Guide (translated):
- MTT S80 ALUs are 128 wide.
- Warp is 128 wide.
- MTT S80 contains 8 MUSA Processor Clusters (MPCs).
- Each MPC contains 2 MUSA Processor Execution Engines (MPXs).
- Each MPX contains 2 MUSA Processors (MPs).
- Each MP consists of the following computing units:
• 128 computing units for single-precision floating-point arithmetic/DP4A.
• 32 computing units for integer operations/bit operations.
• 32 computing units for single-precision floating-point transcendental functions.
• Tensor Compute Engine (TCE), including 1 MMA hardware array, providing IMMA computing
capability.
• 2 computing units for double-precision floating-point operations.
MP also contains:
• 28 KB of local memory
• 0.5 KB of read-only L0 data cache
• 4 KB of L0 instruction cache
For each MPX, multiple MPs will share:
• 24 KB L1 data cache
• 8 KB L1 instruction cache
- For each MPC, multiple MPXs will share 512 KB of L2 cache.

Also from on internet reviews it is known that MTT S80 has 256 ROPs (BXT MC1 has 32 ROPs) and 256 TMUs.

That spec is consistent with Imagination's BXT design, just non-public MC8 version.
If so, MTT S80 should have 16 geometry blocks (I don't know if that's actual units). So why it's so slow in geometry benchmarks?

Chunxiao (MTT S80/MTT S3000) are arch 210 and quyuan (MTT S90/MTT S4000) are arch 220. So MTT S90 should be based on Imagination's B-series too, just BXT MC16.

Loeschzwerg

2024-09-04, 09:17:24

https://x.com/Loeschzwerg_3DC/status/1831219182400106839
FireStrike (Graphics) 7248 -> 8752
Endwalker 6834 -> 8890

PES 250.60 (Feb 2024) -> PES 270.80.0.1 (Aug 2024) =)

Ailuros

2024-09-04, 12:00:59

You can download some SDK and programming guide for Moore Threads. Website needs registration, but you can fill just fake data, like even phone number can be "abc".
https://developer.mthreads.com/sdk/download/musa?equipment=&os=&driverVersion=&version=

Unfortunately I am unable to download SDK. Every time i'm trying downloading is interrupted on 100+ or 300+ MB. Propably because I'm using mobile internet.

From MUSA Programming Guide (translated):
- MTT S80 ALUs are 128 wide.
- Warp is 128 wide.
- MTT S80 contains 8 MUSA Processor Clusters (MPCs).
- Each MPC contains 2 MUSA Processor Execution Engines (MPXs).
- Each MPX contains 2 MUSA Processors (MPs).
- Each MP consists of the following computing units:
• 128 computing units for single-precision floating-point arithmetic/DP4A.
• 32 computing units for integer operations/bit operations.
• 32 computing units for single-precision floating-point transcendental functions.
• Tensor Compute Engine (TCE), including 1 MMA hardware array, providing IMMA computing
capability.
• 2 computing units for double-precision floating-point operations.
MP also contains:
• 28 KB of local memory
• 0.5 KB of read-only L0 data cache
• 4 KB of L0 instruction cache
For each MPX, multiple MPs will share:
• 24 KB L1 data cache
• 8 KB L1 instruction cache
- For each MPC, multiple MPXs will share 512 KB of L2 cache.

Also from on internet reviews it is known that MTT S80 has 256 ROPs (BXT MC1 has 32 ROPs) and 256 TMUs.

That spec is consistent with Imagination's BXT design, just non-public MC8 version.
If so, MTT S80 should have 16 geometry blocks (I don't know if that's actual units). So why it's so slow in geometry benchmarks?

Chunxiao (MTT S80/MTT S3000) are arch 210 and quyuan (MTT S90/MTT S4000) are arch 220. So MTT S90 should be based on Imagination's B-series too, just BXT MC16.

I'm not aware of the exact hw units in S80, but if it has 8 clusters then there should be 8 raster units and not 16 unless I'm missing something.

Also irrelevant if there are 8,16 or even more raster units in S80, but do the hw specs mention anywhere of how many triangles/clock such a GPU is capable of? I'd be personally very surprised if it's more than 1 Tri/clock.

-------------------------------

edit: indirekt zum Thread-thema: https://www.fudzilla.com/news/pc-hardware/59626-china-s-gpu-plans-are-running-aground

Alle Konspirations-Thesen mal zur Seite: 1. Gewinnt man einen solchen Markt nicht ueber Nacht und ja es kostet Unmengen an resources bis man erstmal die eigenen Kosten decken kann und 2. mit beschissenen Treibern ist jegliche hw so oder so wenig wert. Die Antwort hier ist Geduld und das gesamte GPU Paket muss stimmen damit es irgendwann auf eigenen Beinen stehen kann.

mboeller

2024-09-12, 09:52:19

neue DXS GPU für Automotive von IMG:
https://www.imaginationtech.com/products/gpu/dxs-gpu/

Was mir bei der Webseite aufgefallen ist: IMG hat ihre NPU's gehäckselt. Nix mehr zu finden auf der Homepage... na so was.

edit:
wenn man direkt danach sucht findet man die Seite noch:
https://www.imaginationtech.com/products/ai/img-series4-nna/

Aber auf der Produktseite/Übersicht sind die NNA nicht mehr zu finden:
https://www.imaginationtech.com/products/ai/

Vielleicht waren die "Edge-finding" NNA doch "ein wenig" zu speziell und der Markt deshalb sehr gering.

edit2:
dafür haben sie anscheinend ihre GPU entsprechend aufgerüstet. Zumindest bei der neuen DXS-GPU steht Compute im Fokus:

Hardware and software co-optimisations deliver up to 10x compute performance over previous generations, making IMG DXS the ideal GPU IP for supporting common automotive compute workloads such as driver monitoring and LiDAR/RADAR data pre-processing.

Hardware improvements include an additional FP16 pipeline, which when combined with the extra SPU triples the performance of lower-precision operations compared to previous generations of GPUs.

und noch ein edit:

IMG DXD is the first product in a new line of high-performance GPU IP with support for DirectX*. Starting with DirectX Feature Level 11_0, IMG DXD is designed for cloud gaming and desktop graphics experiences, with API coverage to run popular PC games and Windows-based applications.

anscheinend, zumindest lese ich das so ist erst die DXD-GPU wirklich DX11-fähig. Wundert mich dann, wie die alten GPU, die ja zB. MTT als Basis genommen hat die ganzen DX11 Features überhaupt unterstützen.

robbitop

2024-09-12, 10:10:08

I'm not aware of the exact hw units in S80, but if it has 8 clusters then there should be 8 raster units and not 16 unless I'm missing something.

Also irrelevant if there are 8,16 or even more raster units in S80, but do the hw specs mention anywhere of how many triangles/clock such a GPU is capable of? I'd be personally very surprised if it's more than 1 Tri/clock.

-------------------------------

edit: indirekt zum Thread-thema: https://www.fudzilla.com/news/pc-hardware/59626-china-s-gpu-plans-are-running-aground

Alle Konspirations-Thesen mal zur Seite: 1. Gewinnt man einen solchen Markt nicht ueber Nacht und ja es kostet Unmengen an resources bis man erstmal die eigenen Kosten decken kann und 2. mit beschissenen Treibern ist jegliche hw so oder so wenig wert. Die Antwort hier ist Geduld und das gesamte GPU Paket muss stimmen damit es irgendwann auf eigenen Beinen stehen kann.
Was mir auffällt: ziemlich keine Caches und wenn ein warp 128 wide ist wird das ordentlich Performance kosten. Schon bei AMD brachte wave32 ggü. wave64 (gcn->rdna) ordentlich mehr Auslastung. 128 wide ist wahrscheinlich nicht linear schlechter.

Raff

2024-09-12, 11:30:25

Der Kaffee wirkt heute zwar nicht, allerdings fällt mir noch etwas auf: Das sind gar keine 4.096 FP32-ALUs (was die Leistung erklären könnte). Was übersehe ich? Ich schaue am besten nochmal genauer.

Unfortunately I am unable to download SDK. Every time i'm trying downloading is interrupted on 100+ or 300+ MB. Propably because I'm using mobile internet.

Should work now – at least I could fetch it today. 2,44 GByte.

MfG
Raff

robbitop

2024-09-12, 11:36:56

Also ich lese das so:
8 MPCs x 2 MPX x 2 MP x 128 compute units = 4096 single precision fpus. Single Precision = fp32. Double precision wäre fp64.

Raff

2024-09-12, 11:40:07

Um die Verwirrung zu präzisieren: Diese kommt daher, dass in der Dokumentation von MP_10 und MP_21 die Rede ist. Wenn die S80 einem MP_21 entspricht, sind das tatsächlich 4.096 FP32-ALUs + diverse Zusatzwerke für Integer und sogar Tensor.

€dit: Okay, hab’s. Die Übersetzung ist sehr mühsam. MP_21 = Chunxiao = S80, also alles gut. :up:

Original:

MUSA 设备所支持的功能和特性取决于该设备的计算能力，本小节将介绍苏堤、春晓架构分别对应的计算能力
MP_10、MP_21。

MfG
Raff

mboeller

2024-09-12, 12:30:05

(was die Leistung erklären könnte).

vielleicht hängt es ja damit zusammen dass MTT und die anderen GPu-Hersteller keine DXD benutzen konnten sondern nur eine BXS-Lizenz hatten. Und erst DXD ist anscheinend, siehe mein Posting oben drüber DX11 Kompatibel

robbitop

2024-09-12, 12:51:32

Die Treiber scheinen außerdem hot garbage zu sein. Und wenn das ding wirklich mit wave128 arbeitet ist es wahrscheinlich nicht besonders toll ausgelastet. Dazu die winzigen Caches. Scheint so zu sein als wenn IMG IP nicht mehr das ist was es mal wae

Ailuros

2024-09-13, 12:27:07

Was mir auffällt: ziemlich keine Caches und wenn ein warp 128 wide ist wird das ordentlich Performance kosten. Schon bei AMD brachte wave32 ggü. wave64 (gcn->rdna) ordentlich mehr Auslastung. 128 wide ist wahrscheinlich nicht linear schlechter.

Ausser es hat sich etwas geaendert cache sizes haengen stets von IHV ab der die IP implementiert; im kleinkarierten steht dann eventuell drin dass GPU IP von-bis zu cache sizes haben kann.

Fuer das neue automotive Zeug dass mboeller oben verlinkt, behauptet IMG eine bis zu 80% Auslastung fuer compute in den ALUs. Nebenbei im ganzen Marketing-Gefusel soll die neue automotive GPU IP bis zu 10x Mal mehr compute als der Vorgaenger erreichen.

a. ein FP16 Kanal mehr
b. upgraded firmware der ein besseres housekeeping besorgt
c. Architektur-bedingte "secret sauce"

Die Treiber scheinen außerdem hot garbage zu sein. Und wenn das ding wirklich mit wave128 arbeitet ist es wahrscheinlich nicht besonders toll ausgelastet. Dazu die winzigen Caches. Scheint so zu sein als wenn IMG IP nicht mehr das ist was es mal wae

Unter Android bzw. iOS leisten die Tiere schon was ihr marketing verspricht; neben der Moeglichkeit einer beschissenen hw Implementierung fuer die S80 und co. GPUs hatte IMG NIE fuer ihre ULP SoCs anstaendige windows Treiber.

OT aber dass Apple im GPU Bereich fuer SoCs nachlaesst gegenueber QCOM (in ULP SoCs), ist eine bewusste design-Entscheidung seitens Apple und nicht dass nicht mehr moeglich ist. In absehbarer Zukunft waere es interessant zu sehen wie sich eine skalierte M4 GPU gegen QCOMs Elite GPUs vergleicht.

hikimiru

2024-09-13, 23:27:48

I'm not aware of the exact hw units in S80, but if it has 8 clusters then there should be 8 raster units and not 16 unless I'm missing something.

Also irrelevant if there are 8,16 or even more raster units in S80, but do the hw specs mention anywhere of how many triangles/clock such a GPU is capable of? I'd be personally very surprised if it's more than 1 Tri/clock.

-------------------------------

edit: indirekt zum Thread-thema: https://www.fudzilla.com/news/pc-hardware/59626-china-s-gpu-plans-are-running-aground

Alle Konspirations-Thesen mal zur Seite: 1. Gewinnt man einen solchen Markt nicht ueber Nacht und ja es kostet Unmengen an resources bis man erstmal die eigenen Kosten decken kann und 2. mit beschissenen Treibern ist jegliche hw so oder so wenig wert. Die Antwort hier ist Geduld und das gesamte GPU Paket muss stimmen damit es irgendwann auf eigenen Beinen stehen kann.

It's 2x geometry raster unit per BXT MC1.
https://images.anandtech.com/doci/16155/PowerVR-GPU-B-Series-16.png

hikimiru

2024-09-13, 23:37:17

neue DXS GPU für Automotive von IMG:
https://www.imaginationtech.com/products/gpu/dxs-gpu/

Was mir bei der Webseite aufgefallen ist: IMG hat ihre NPU's gehäckselt. Nix mehr zu finden auf der Homepage... na so was.

edit:
wenn man direkt danach sucht findet man die Seite noch:
https://www.imaginationtech.com/products/ai/img-series4-nna/

Aber auf der Produktseite/Übersicht sind die NNA nicht mehr zu finden:
https://www.imaginationtech.com/products/ai/

Vielleicht waren die "Edge-finding" NNA doch "ein wenig" zu speziell und der Markt deshalb sehr gering.

edit2:
dafür haben sie anscheinend ihre GPU entsprechend aufgerüstet. Zumindest bei der neuen DXS-GPU steht Compute im Fokus:

und noch ein edit:

anscheinend, zumindest lese ich das so ist erst die DXD-GPU wirklich DX11-fähig. Wundert mich dann, wie die alten GPU, die ja zB. MTT als Basis genommen hat die ganzen DX11 Features überhaupt unterstützen.

DirectX support in Imagination's designes are a matter of optional feature packs. Same for FP64 support.
https://blog.imaginationtech.com/powervr-series7xt-gpus-push-graphics-and-compute-performance/
https://images.anandtech.com/doci/8706/Series7XT_Features_575px.png

hikimiru

2024-09-13, 23:52:41

neue DXS GPU für Automotive von IMG:
https://www.imaginationtech.com/products/gpu/dxs-gpu/

Was mir bei der Webseite aufgefallen ist: IMG hat ihre NPU's gehäckselt. Nix mehr zu finden auf der Homepage... na so was.

edit:
wenn man direkt danach sucht findet man die Seite noch:
https://www.imaginationtech.com/products/ai/img-series4-nna/

Aber auf der Produktseite/Übersicht sind die NNA nicht mehr zu finden:
https://www.imaginationtech.com/products/ai/

Vielleicht waren die "Edge-finding" NNA doch "ein wenig" zu speziell und der Markt deshalb sehr gering.

edit2:
dafür haben sie anscheinend ihre GPU entsprechend aufgerüstet. Zumindest bei der neuen DXS-GPU steht Compute im Fokus:

und noch ein edit:

anscheinend, zumindest lese ich das so ist erst die DXD-GPU wirklich DX11-fähig. Wundert mich dann, wie die alten GPU, die ja zB. MTT als Basis genommen hat die ganzen DX11 Features überhaupt unterstützen.
Was mir auffällt: ziemlich keine Caches und wenn ein warp 128 wide ist wird das ordentlich Performance kosten. Schon bei AMD brachte wave32 ggü. wave64 (gcn->rdna) ordentlich mehr Auslastung. 128 wide ist wahrscheinlich nicht linear schlechter.

Since Furian there is a "specialised ALU"/"secondary ALU" (since A-series). Primary ALU is ultra-wide, but it was simplified. Complex instructions are executed on specialised ALU blocks. They are independent of primary ALU, and they are 32-wide.
https://www.anandtech.com/show/15156/imagination-announces-a-series-gpu-architecture/2

Ailuros

2024-09-18, 15:33:12

It's 2x geometry raster unit per BXT MC1.
https://images.anandtech.com/doci/16155/PowerVR-GPU-B-Series-16.png

Agreed. It still doesn't answer your own question about slow geometry performance. If all 16 raster units could theoretically process anything above say 4 triangles/clock then there's something else wrong. In the other case where the B-Series still can't process more than 1 Tri/clock (which was the case with their past multi-core IP), irrelevant of how many raster units in a design, then that at least explains slow geometry performance.

Note that none of these TBDRs (present or past designs) digest well with any form of excessive tessellation either, which I suspect is rather an architectural problem than anything else. In Kishonti's synthetic benchmarks PowerVRs perform as expected in the Car Chase test, as it has a very small portion of tessellation. In the low level Tessellation test (wherever possible to run it, since Apple for example has it disabled) they all perform quite bad.

hikimiru

2024-09-22, 22:59:01

Agreed. It still doesn't answer your own question about slow geometry performance. If all 16 raster units could theoretically process anything above say 4 triangles/clock then there's something else wrong. In the other case where the B-Series still can't process more than 1 Tri/clock (which was the case with their past multi-core IP), irrelevant of how many raster units in a design, then that at least explains slow geometry performance.

Note that none of these TBDRs (present or past designs) digest well with any form of excessive tessellation either, which I suspect is rather an architectural problem than anything else. In Kishonti's synthetic benchmarks PowerVRs perform as expected in the Car Chase test, as it has a very small portion of tessellation. In the low level Tessellation test (wherever possible to run it, since Apple for example has it disabled) they all perform quite bad.

Mystery is propably solved. My old suspicion, that Moore Threads are using secondary cores design, was right. They define primary and non_primary (secondary) cores in mtgpu driver. From musa driver:

#define MTGPU_GPU_CORE_NON_PRIMARY 0xF
/*
* group_type is gpu multi primary core group type,
* example:
* 4+4, {4, 4, 0, 0, 0, 0, 0, 0,...}
* 4+2+2, {4, 2, 2, 0, 0, 0, 0, 0,...}
* 1+1+1+1+1+1+1+1, {1, 1, 1, 1, 1, 1, 1, 1,...}
*/
struct gpu_cfg_req {
u8 group_type[MTGPU_CORE_COUNT_MAX];
};
https://github.com/dixyes/mtgpu-drv/blob/552be0f663400ac96d6c41e847e8f5a98d247bd4/inc/mtgpu/mtgpu.h#L94

/**
* MPC info indicates the logical core id, physical core id and multi primary core id start with 0.
* Each primary core can create multi osids, and osid may be same on different primary core. To
* locate the resources, the vgpu instance has to know which primary core it is on. So it is
* necessary to touch the primary core info as convenient as possible.
*/
struct mtgpu_mpc_info {
/* id of the multicore that this core on. Start with 0. */
u32 mpc_id;
/* the logical id of the primary core of the multicore that this core on. */
u32 logical_core_id;
/* the physical id of the primary core of the multicore that this core on. */
u32 physical_core_id;
};
https://github.com/cl91/mtgpu-drv/blob/b63029ae750a25602ef69b1952318b3af0db09bd/inc/mtgpu/mtgpu_mdev.h#L245

They define MTGPU_CORE_COUNT_MAX as 32, and MTGPU_GPU_CORE_NON_PRIMARY as 0xf (so 15 and counting from 0 means 16). Not sure what they are meaning as "core_count", it is not MC/MPC, because there is 8 of them. Maybe USCs? MC1=4 USCs, so MC8=32 USCs.

Whilst the BXT and BXM series GPUs until now are delivered as “primary” cores, the BXE is being offered in the form of both a primary as well as a secondary GPU implementation. The differences here is that the secondary variant of the IP lacks a firmware processor as well as a geometry processing, instead fully relying on the primary GPU’s geometry throughput. Imagination says that this configuration would be able to offer quite high compute and fillrate capabilities in extremely minuscule area usage.
https://www.anandtech.com/show/16155/imagination-announces-bseries-gpu-ip-scaling-up-with-multigpu/2
So Moore Threads halved geometry and FW processor capabilities. Although this is propably new-normal and efficient way to emulate geometry on compute shaders (Asahi did this for Apple M1), maybe that is why they need to optimize driver title by title.
FWP is responsible for high-level scheduling, context switching, and power control (power domain, DVFS).
It is not a good information, if they are willing to support dx12. Until DXT, contex switching works more like old Nvidia cards (Maxwell and Pascal sometimes looses performance in dx12).
ttps://blog.imaginationtech.com/pipelined-data-masters-in-d-series-gpu

Secondary cores was an option only for BXE design. So MTT uses customized BXT-32-1024-MC8 (or MC4xMP2) Primary/Secondary design.
I wonder how they arranged MCs.
PPPPSSSS
PSPSPSPS

I want to say that Moore Threads internal (driver mostly) naming schem is a mess.
Mtt S80 arch marketing name is Chunxiao, but in drivers it is qy1, quyuan1, quyu1.
MTT s90 marketing name is actually Quyuan, but in drivers it is quyuan2, qy2, quyu2.
They are also baking Quyuan3/quyu3 (propably cancelled, or changed name, bc non-existed in new driver version), Apollo (not sure if it is not ImgTech emulator), Pinghu (pinghu1, pihu1, ph1) and Pinghu2 (pihu2). Pinghu has next 0x400 PCI sub-ID.

Ailuros

2024-09-24, 15:46:55

Mystery is propably solved. My old suspicion, that Moore Threads are using secondary cores design, was right. They define primary and non_primary (secondary) cores in mtgpu driver. From musa driver:

#define MTGPU_GPU_CORE_NON_PRIMARY 0xF
/*
* group_type is gpu multi primary core group type,
* example:
* 4+4, {4, 4, 0, 0, 0, 0, 0, 0,...}
* 4+2+2, {4, 2, 2, 0, 0, 0, 0, 0,...}
* 1+1+1+1+1+1+1+1, {1, 1, 1, 1, 1, 1, 1, 1,...}
*/
struct gpu_cfg_req {
u8 group_type[MTGPU_CORE_COUNT_MAX];
};
https://github.com/dixyes/mtgpu-drv/blob/552be0f663400ac96d6c41e847e8f5a98d247bd4/inc/mtgpu/mtgpu.h#L94

/**
* MPC info indicates the logical core id, physical core id and multi primary core id start with 0.
* Each primary core can create multi osids, and osid may be same on different primary core. To
* locate the resources, the vgpu instance has to know which primary core it is on. So it is
* necessary to touch the primary core info as convenient as possible.
*/
struct mtgpu_mpc_info {
/* id of the multicore that this core on. Start with 0. */
u32 mpc_id;
/* the logical id of the primary core of the multicore that this core on. */
u32 logical_core_id;
/* the physical id of the primary core of the multicore that this core on. */
u32 physical_core_id;
};
https://github.com/cl91/mtgpu-drv/blob/b63029ae750a25602ef69b1952318b3af0db09bd/inc/mtgpu/mtgpu_mdev.h#L245

They define MTGPU_CORE_COUNT_MAX as 32, and MTGPU_GPU_CORE_NON_PRIMARY as 0xf (so 15 and counting from 0 means 16). Not sure what they are meaning as "core_count", it is not MC/MPC, because there is 8 of them. Maybe USCs? MC1=4 USCs, so MC8=32 USCs.

Whilst the BXT and BXM series GPUs until now are delivered as “primary” cores, the BXE is being offered in the form of both a primary as well as a secondary GPU implementation. The differences here is that the secondary variant of the IP lacks a firmware processor as well as a geometry processing, instead fully relying on the primary GPU’s geometry throughput. Imagination says that this configuration would be able to offer quite high compute and fillrate capabilities in extremely minuscule area usage.
https://www.anandtech.com/show/16155/imagination-announces-bseries-gpu-ip-scaling-up-with-multigpu/2
So Moore Threads halved geometry and FW processor capabilities. Although this is propably new-normal and efficient way to emulate geometry on compute shaders (Asahi did this for Apple M1), maybe that is why they need to optimize driver title by title.
FWP is responsible for high-level scheduling, context switching, and power control (power domain, DVFS).
It is not a good information, if they are willing to support dx12. Until DXT, contex switching works more like old Nvidia cards (Maxwell and Pascal sometimes looses performance in dx12).
ttps://blog.imaginationtech.com/pipelined-data-masters-in-d-series-gpu

Secondary cores was an option only for BXE design. So MTT uses customized BXT-32-1024-MC8 (or MC4xMP2) Primary/Secondary design.
I wonder how they arranged MCs.
PPPPSSSS
PSPSPSPS

I want to say that Moore Threads internal (driver mostly) naming schem is a mess.
Mtt S80 arch marketing name is Chunxiao, but in drivers it is qy1, quyuan1, quyu1.
MTT s90 marketing name is actually Quyuan, but in drivers it is quyuan2, qy2, quyu2.
They are also baking Quyuan3/quyu3 (propably cancelled, or changed name, bc non-existed in new driver version), Apollo (not sure if it is not ImgTech emulator), Pinghu (pinghu1, pihu1, ph1) and Pinghu2 (pihu2). Pinghu has next 0x400 PCI sub-ID.

I doubt that they'd need more than 1 firmware processor for any reasonable MP setup; as for skipping rasters in a multi-core design: if the design scales geometry throughput while scaling raster units in a multi-core config it would be idiotic to skip even one raster unit since it's my understanding that the area consumed for it should be at around 5% of the entire full single core area. In the other case where the amount of triangles/clock remains the same whether 1 or 8 raster units in an MP, it makes sense to skip the raster units, as anything above 1 raster would be redundant.

hikimiru

2024-09-24, 17:17:55

I doubt that they'd need more than 1 firmware processor for any reasonable MP setup; as for skipping rasters in a multi-core design: if the design scales geometry throughput while scaling raster units in a multi-core config it would be idiotic to skip even one raster unit since it's my understanding that the area consumed for it should be at around 5% of the entire full single core area. In the other case where the amount of triangles/clock remains the same whether 1 or 8 raster units in an MP, it makes sense to skip the raster units, as anything above 1 raster would be redundant.

For BXE cores with P/S design, only geometry is cutted. Raster units count stays the same.
So MTT S80 with customized BXT P/S should have 8 geometry units and still 16 raster units.
I'm not shure, how it works with tessellators these days. Tessellation co-processor was optional for Rogue XE.

Raff

2024-09-25, 12:01:43

Nach Monaten des Messens und Recherchierens ist es vollbracht:

Moore Threads MTT S80 im ersten vollwertigen Test: Dauerbaustelle mit Mega-Fortschritt (https://www.pcgameshardware.de/Moore-Threads-MTT-S80-Grafikkarte-280817/Tests/Treiber-Benchmarks-Full-Review-1455478/)

"[...] ersten vollumfänglichen Test der schnellsten Grafikkarte "Made in China" - mit Benchmarks, Lautheit, Leistungsaufnahme, Effizienz und vielem mehr."

Ich würde mich über Feedback und offensives Teilen freuen. =)

MfG
Raff

davidzo

2024-09-25, 12:28:46

Mega Raff was du in diesem Busy Herbst nochmal eben so an Tests raushausts! Zumal das auf der Treiberbasis sicher nervenaufreibender ist als ein neuer Nvidia, AMD, Intel-Launch.

A380 / RX6400 Niveau ist aber immer noch Faktor 3-4x unter dem was man konservativ erwarten würde. Mal sehen ob die im Treiber noch einen großen Roadblock finden. Es wäre schon toll wenn MTT nicht den XGI Weg geht sondern noch einen zweiten Versuch hat, ggf. mit einem kleineren Chip in einer moderneren Architektur.

mczak

2024-09-25, 14:09:14

A380 / RX6400 Niveau ist aber immer noch Faktor 3-4x unter dem was man konservativ erwarten würde. Mal sehen ob die im Treiber noch einen großen Roadblock finden.
Daran zweifle ich. Klar der Treiber ist offensichtlich ein Haufen Schrott, aber gerade bei den Best-Case Fällen (wo auch der Stromverbrauch etwas nach oben geht also die Auslastung offenbar etwas besser ist) dürfte IMHO nicht allzu viel mehr möglich sein - das ist dann immer noch bloss RX 6400 / Arc A380 Niveau. Der Chip soll ja (nach kurzer Suche, keine Ahnung ob das schon erwähnt wurde) 22 Mrd Transistoren haben bei einer Grösse von 426mm², in einer relativ modernen Fertigung (TSMC 7nm), das ist dann im Vergleich schon enorm.
Ich denke eher das harzt bei der HW, die zwar breit ist aber wohl zu wenig smart. Dass eine Warp-Size von 128 nicht ideal ist wurde ja schon erwähnt, möglicherweise hat man auch zu wenig Warps In-Flight (aufgrund mangelnder Kontrollogik oder zu wenig Register beispielsweise, oder grundlegende Synchronisationsprobleme weil man ja am Ende garantieren muss dass es so aussieht als ob die Threads In-Order abgearbeitet werden).
Wahrscheinlich harzt es an vielen Stellen (wenn es bloss einen Grund geben würde hätte man das ja wohl schon zum Voraus erkannt), das wird IMHO mit diesem Chip nichts mehr.

Ailuros

2024-09-25, 14:49:08

Nach Monaten des Messens und Recherchierens ist es vollbracht:

Moore Threads MTT S80 im ersten vollwertigen Test: Dauerbaustelle mit Mega-Fortschritt (https://www.pcgameshardware.de/Moore-Threads-MTT-S80-Grafikkarte-280817/Tests/Treiber-Benchmarks-Full-Review-1455478/)

"[...] ersten vollumfänglichen Test der schnellsten Grafikkarte "Made in China" - mit Benchmarks, Lautheit, Leistungsaufnahme, Effizienz und vielem mehr."

Ich würde mich über Feedback und offensives Teilen freuen. =)

MfG
Raff

Ausgezeichnete Arbeit (wie immer). PowerVR oder nicht, mir wuerde persoenlich keine GPU in die Kiste kommen, die heute ueber 100W im Leerlauf verbraucht (ist ja auch nichts Neues). Neben den unterirdischen Treibern, kommt noch die unterdurchschnittliche Implementierung der IP dazu.

Ich hab zwar keine Ahnung ob China vorhat weiterhin in GPU Entwicklung zu investieren, aber es sieht bis jetzt nicht gut aus. Haetten sie heute ein equivalentes "KYRO-Resultat" gelandet, dann wuerde es auch viel mehr Hoffnung fuer die Zukunft geben. Mich wuerde es nicht wundern wenn China zumindest fuer die absehbare Zukunft die GPU Affaere aufgibt und Imagination hat somit auch keine anstaendige Alternative gelandet fuer den ziemlich grossen Verlust im ULP SoC Markt.

Doch das ist nur eine Frage der Zeit, sofern die Firma aus Peking am Ball bleibt. Wer weiß, vielleicht haben wir schon in fünf, voraussichtlich eher zehn Jahren einen ernst zu nehmenden vierten Spieler auf dem Feld der Grafikkarten?

Wenn IMG langfristig (>5 Jahre) kein Geschaeft landen kann damit sie auch wirklich ueberleben koennen, schluckt sie im besten Fall einfach Apple hauptsaechlich fuer die Patente.

Apple bezahlt jede ~5-7 Jahre eine Architektur-Lizenz (<handvoll $Mio), fuer smartphones und tablets ist IMG heute leider ein minority report und sie haben im automotive Markt noch einen guten Marktanteil fuer GPU IP, aber der Gewinn dort ist zu gering. Mit der CPU IP/RISC V Geschichte sieht es auch nach Nichts aus (ausser ich hab irgend etwas verpasst).

Ich hab den Link schonmal hier im thread gepostet: https://www.eetimes.com/imagination-raises-100-million-investment-to-take-on-edge-ai/ ....ach ja AI und etwas dass mit NV's CUDA konkurrieren soll? yeahrightsureok.....

hikimiru

2024-09-26, 16:12:07

Ich hab den Link schonmal hier im thread gepostet: https://www.eetimes.com/imagination-raises-100-million-investment-to-take-on-edge-ai/ ....ach ja AI und etwas dass mit NV's CUDA konkurrieren soll? yeahrightsureok.....

This loan cost them sharing of ~1300 patents.
https://patents.google.com/?assignee=Fortress+Investment+Group&num=100

Not a good deal considering consortium with ARM pays 350 million USD in cash for <600 MIPS patents.

Raff

2024-09-27, 20:41:36

Falls jemand noch etwas mehr Info sucht und des Lesens überdrüssig ist: =)

6fugxs0YdNQ

Beste Grüße von der Insel,
Raff

Loeschzwerg

2024-10-16, 13:11:36

Es gibt einen ersten DX12 Treiber im Alpha-Stadium:
https://www.mthreads.com/news/210

Feature Level unbekannt.

Thx @ Hikimiru

Raff

2024-10-16, 13:17:21

Wow, dass wir das noch erleben dürfen. :eek: Beim Wort "Alpha" kriege ich aber immer 'nen Würgereiz.

MfG
Raff

Loeschzwerg

2024-10-16, 13:19:42

Schlimmer als die ersten paar Treiber wird es schon nicht sein ^^ Mich kann da schon fast nichts mehr schocken :D

Loeschzwerg

2024-10-16, 18:55:52

https://x.com/Loeschzwerg_3DC/status/1846594085437481279

DX12 läuft tatsächlich und sogar stabil im 3DMark :eek::cool:

89813
89814
89815
89816

Zu den DX12 Caps... Naja, schaut einfach den GPU-Z Screenshot an ^^

Edit:
Und noch Nachschub mit dem Steel Nomad:
89817

https://x.com/Loeschzwerg_3DC/status/1846600995318440113

davidzo

2024-10-16, 21:10:21

Danke Loeschzwerg!

Also etwa RX570 / RX6400 Niveau in Timespy, aber nur GTX950 Niveau in Steel Nomad light (1440p). Oder ist das Steel Nomad standard aber mit veränderter Auflösung? Der default steel nomad ist ja in 4k. In dem Fall wäre das ebenfalls ca rx580/GTX1060 Niveau.

Loeschzwerg

2024-10-17, 06:46:30

Gerne :smile:

Es ist der normale Steel Nomad im Default, also nicht die Light Variante. Die Karte kann unter DX12 praktisch nicht wirklich mehr Leistung freisetzen (zumindest aktuell), aber immerhin erhöht sich die Kompatibilität.

Raff

2024-10-18, 10:31:17

Ergänzend zu Löschzwergs Werten - hier alle Ergebnisse der MTT S80 in den neuerdings lauffähigen Tests Time Spy (Extreme) und Steel Nomad (Light): :up:

https://www.pcgameshardware.de/3DMark-Software-122260/Specials/Punkte-Tabelle-Time-Spy-Benchmark-1357989/2/

MfG
Raff

Loeschzwerg

2024-10-18, 10:34:37

Thx =)

Maniac81 hat übrigens seine S70 durch den Nomad gejagt. Erstaunlich wie stark die Karte dort verglichen zur S80 einbricht.
Die Nutzung von PCIe 5.0 gegenüber 4.0 und eine stärkere CPU haben soweit keinen Einfluss.

==> https://www.computerbase.de/forum/threads/moore-threads-sammelthema-u-a-mtt-s80.2128604/page-4#post-29881268

Raff

2024-10-18, 10:36:55

Apropos, der PEG-Test attestiert auf meiner Kiste ~22 GByte/s - weniger als bei modernen 4.0er-GPUs. So schade, dass da nicht wenigstens ~30 herauskommen, dann gäbe es zumindest einen Test auf der Welt, wo die Karte schneller als RTX 4090 & Co. ist. :biggrin:

WWRgoh486Ho

MfG
Raff

Raff

2024-10-21, 10:52:02

Moin!

Ergänzend hier alle nun lauffähigen 3DMark-Tests auf der MTT S80 in Videoform. Capturing nicht via GPU, sondern durchgeschleift via Elgato.

Zpphhb_YBu4

MfG
Raff

Loeschzwerg

2024-10-21, 11:43:55

Die S30 will @DX12 zumindest noch nicht, aber ich habe beiläufig entdeckt das nun Final Fantasy XV läuft.

Raff

2024-10-21, 11:51:17

Interessanter Fund. Bislang dachte ich, dass die explizite Nennung der S70 und S80 bei der Treiberkompatibilität nur erfolgte, weil hier die Chance auf Spielbarkeit besteht.

MfG
Raff

konkretor

2024-10-21, 13:03:13

Also wer eine MTT Karte hat, kann ja mal etwas Benchen

https://github.com/ggerganov/llama.cpp

Das Backend was MUSA genannt wird ist supported

https://github.com/ggerganov/llama.cpp/blob/master/docs/build.md#musa

Die Karte ist ja nicht nur für Gaming beworben worden

hikimiru

2024-10-23, 15:07:35

There is newer (2.7 release candidate) driver for Ubuntu, than on site.
https://docs.mthreads.com/musa-sdk/musa-sdk-doc-online/install_guide/

Loeschzwerg

2024-11-21, 09:25:19

New driver release from Moore Threads, PES 280.90 (2024-11-20):
https://www.mthreads.com/pes/drivers/driver-info/DESKTOP_MTT_S80/release-note/v280.90?productType=DESKTOP&osVersion=Windows%2011

《黑神话：悟空》在DirectX 12 API下的游戏体验优化；
《文明6》在DirectX 12 API下的游戏体验优化；
《狂野飙车：传奇集结》在DirectX 12 API下的游戏体验优化；
《三角洲行动》游戏体验优化；
《哈迪斯2》游戏体验优化；
《七日世界》游戏体验优化；
《战争雷霆》游戏体验优化；
支持 SketchUp Pro 2024 新图形引擎（DirectX 12）；

Optimizations for Black Myth, Civ 6, War Thunder, Hades 2, Asphalt Legends...

Raff

2024-11-21, 09:30:16

Moin!

Witzig, der war gestern, als ich nachsah, noch nicht da. Checke ich gleich mal mit Stalker 2. :up:

MfG
Raff

hikimiru

2024-11-24, 13:27:11

Hey Raff,
Your spec is wrong. MTT S80 has 16MB of LLC/L3 cache.

https://blog.mthreads.com/blog/musa/2024-05-11-MUSA%E7%A1%AC%E4%BB%B6%E6%9E%B6%E6%9E%84%E4%B8%8EGPU%E5%B9%B6%E8%A1%8C%E7%A8%8B% E5%BA%8F%E5%9F%BA%E7%A1%80/#1%E5%BC%95%E8%A8%80

Ailuros

2025-01-03, 16:25:00

Nichts besonderes, aber ich kann mir gut vorstellen dass die meisten IHVs aehnliche Kopfschmerzen hatten/haben bei der Entwicklung von naechster Generation AI hw: https://blog.imaginationtech.com/embracing-flexibility-in-edge-ai