PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Mali ALUs


Coda
2012-08-27, 20:57:46
Mal was interessantes aus einem Reverse-Engineering-Projekt:

Pixel-Shader:
http://img850.imageshack.us/img850/1056/limapipelinehorizontal2.png

Vertex-Shader:
http://img857.imageshack.us/img857/6044/limavertexpipeline.png

The fuck? :ugly: Das sieht ja aus wie NV30.

StefanV
2012-08-28, 14:53:33
sind die mobilen GPUs wirklich so weit hinter den Desktop GPUs?!

Also technologisch...

RLZ
2012-08-28, 15:09:03
The fuck? :ugly: Das sieht ja aus wie NV30.
Hättest dabei schreiben können, dass es sich wohl um Mali dreht. ;)

sputnik1969
2012-08-29, 10:12:38
Hättest dabei schreiben können, dass es sich wohl um Mali dreht. ;)
Wenn du den Threadtitel gelesen hättest, hättest Du dir den KOmmentar sparen können ;)

robbitop
2012-08-29, 11:30:55
Welcher Mali ist es denn? Die 400er Serie oder?

Ailuros
2012-08-29, 11:53:46
Welcher Mali ist es denn? Die 400er Serie oder?

Mali55/200/400 da es dort getrennte PS und VS ALUs gibt. Die kommende T6xx Generation hat (endlich) USCs.

sind die mobilen GPUs wirklich so weit hinter den Desktop GPUs?!

Also technologisch...

Nicht alle. Als die obrige Mali GPU IP entwickelt wurde war Falanx Finnland noch ein kleines startup Firmchen welches in der Zwischenzeit von ARM aufgekauft wurde. Erstens ist es eine geraume Zeit her dass das Zeug entwickelt wurde und zweitens kann man mit ein paar Dutzend Personal auch nicht besonders viel auf die Beine stellen.

Groesste Schwaeche dieser Generation ist dass zwar fragment cores in Anzahl skalieren koennen aber es ist nur immer eine einzige VS ALU moeglich.

Der Mali400MP4 in GalaxySII und SIII smartphones hat 4 fragment cores (FP16, Vec4 PS ALUs mit jeweils 1 TMU/fragment core) und 1 Vec2 (FP32) VS ALU.

Gaestle
2012-08-29, 12:40:09
Wenn das Design so aussieht wie NV30, hat es auch dessen Probleme?

Kann man von einer "VS-Schwäche" schreiben, oder sind die anderen Designs aus diesem Zeitraum ähnlich aufgestellt?

Coda
2012-08-29, 12:47:52
Wenn das Design so aussieht wie NV30, hat es auch dessen Probleme?
Sieht so aus, als wäre die TMU in der Vertex-Pipeline und nicht separat, also ja.

Das Design ist ziemlich mittelalterlich.

-/\-CruNcher-/\-
2012-08-29, 15:11:42
Also nix mit CryEngine auf Mali Smartphones ;) ?

Coda
2012-08-29, 15:24:56
Haha, witzig.

Gaestle
2012-08-29, 15:55:32
Danke. :)

Lief das angesprochene "Reverse Engineering Project" bei Euch im Haus?

Ailuros
2012-08-29, 16:02:36
Sieht so aus, als wäre die TMU in der Vertex-Pipeline und nicht separat, also ja.

Das Design ist ziemlich mittelalterlich.

Entschuldige die bloede Frage aber wie genau ist die TMU in der vertex pipeline auf Mali? So wie ich es verstanden habe kommt jede fragment ALU mit einer TMU; bei single core Mali200 ist es 1Vec4 PS ALU/1TMU und 1 Vec2 VS ALU.
Mali400MP4 sind es dann 4Vec4 PS ALUs/4TMUs und 1Vec2 VS ALU. Was verpass ich gerade?

Coda
2012-08-29, 17:29:26
Schau doch einfach das Bildchen an.

Coda
2012-08-29, 17:30:59
Danke. :)

Lief das angesprochene "Reverse Engineering Project" bei Euch im Haus?
Nicht alles was ich poste (genauer gesagt das wenigste) hat damit zu tun. Das ist von http://limadriver.org/

Gaestle
2012-08-29, 22:01:50
Ui. Ich wusste gar nicht, dass es solche OpenSource-Treiber-Entwicklungen gibt. *staun*

Coda
2012-08-29, 22:45:59
Geht noch viel erstaunlicher:
http://nouveau.freedesktop.org/wiki/

sputnik1969
2012-08-29, 22:50:41
Geht noch viel erstaunlicher:
http://nouveau.freedesktop.org/wiki/

Was ist daran erstaunlicher? Der Bedarf dafür war schon lange sichtbar. Ich bin mir nur nicht so sicher, ob der Bedarf an freien MobileGPU-Treibern genauso groß ist wie der Bedarf an DesktopGPU-Treibern. Im Augenblick denke ich eher nicht, da die SoCs ja meist mit (festgelegtem) Betriebssystem vertrieben und genutzt werden, während normale PCs eher mit einem anderen OS versehen werden.

Coda
2012-08-29, 22:52:00
Was ist daran erstaunlicher?
Weil das komplett clean room reverse engineering ist? Für so ziemlich alle NVIDIA-GPUs?

RavenTS
2012-09-01, 15:44:37
Wenn es nun wie ein nV30-Design aussieht, könnte da nicht nVIDIA mit irgendwelchen Patenten/Design- oder sonstwasMustern ankommen? Oder wird eine Chiparchitektur an sich nicht geschützt weil ja öffentlich nicht kommuniziert?

Ailuros
2012-09-01, 22:25:04
Wenn es nun wie ein nV30-Design aussieht, könnte da nicht nVIDIA mit irgendwelchen Patenten/Design- oder sonstwasMustern ankommen? Oder wird eine Chiparchitektur an sich nicht geschützt weil ja öffentlich nicht kommuniziert?

Die ALUs erinnern den NV30 und sind keine 1:1 Kopie. Selbst wenn ich wuerde liebend gerne sehen dass NV NV30 patentiert hat und dafuer sogar andere aufs Gericht jagt. Es wird dann auch eine Seifenoper dafuer im US Fernsehen geben unter dem Titel: "How to patent a FLOP" :freak:

DaBrain
2012-09-02, 15:31:05
Kann man von einer "VS-Schwäche" schreiben[...]

Wie genau wirkt sich das nochmal aus?

Bzw. was sollte man bei einem Programm/Spiel, dass auf dem Mali laufen soll beachten?

Botcruscher
2012-09-02, 16:00:30
Es wird dann auch eine Seifenoper dafuer im US Fernsehen geben unter dem Titel: "How to patent a FLOP" :freak:

Bei dem Patentwesen schon nicht mehr lustig. Na immerhin sind die Ecken im Schaubild nicht rund.:freak:

Coda
2012-09-02, 23:15:54
Die ALUs erinnern den NV30 und sind keine 1:1 Kopie. Selbst wenn ich wuerde liebend gerne sehen dass NV NV30 patentiert hat und dafuer sogar andere aufs Gericht jagt. Es wird dann auch eine Seifenoper dafuer im US Fernsehen geben unter dem Titel: "How to patent a FLOP" :freak:
NV40 und G70 hatten im Prinzip den selben prinzipiellen Aufbau (übrigens 3dfx' Rampage auch).

Gaestle
2012-09-03, 09:09:33
Wie genau wirkt sich das nochmal aus?

Bzw. was sollte man bei einem Programm/Spiel, dass auf dem Mali laufen soll beachten?

Nach dem, wie ich (als VollN00b) Codas und Ailuros Aussagen deute ...

Sieht so aus, als wäre die TMU in der Vertex-Pipeline und nicht separat, also ja.

Das Design ist ziemlich mittelalterlich.

Groesste Schwaeche dieser Generation ist dass zwar fragment cores in Anzahl skalieren koennen aber es ist nur immer eine einzige VS ALU moeglich.

Der Mali400MP4 in GalaxySII und SIII smartphones hat 4 fragment cores (FP16, Vec4 PS ALUs mit jeweils 1 TMU/fragment core) und 1 Vec2 (FP32) VS ALU.

...würde ich sagen, dass die Malis auf eine VS-Einheit beschränkt sind, die zudem noch unglücklich platziert bzw. verknüpft ist. Somit wären nach meinem Verständnis auch die Möglichkeiten der Geometrie beschränkt. Gleichzeitig steigen die Auflösungen (und damit die Grafiklast an die eigebauten GPUs) auf mobilen Geräten. 720p werden wohl in absehbarer Zeit Standard. Auf den Winz-Monitoren in mobilen Geräten ist eine nicht so aufwändige Geometrie wahrscheinlich egal, aber wenn man MALI per HDMI zum Zocken an einen TV stöpselt, kann das vielleicht auffallen, wenn die Geometrie eher grob ist.

Aber das wird sicher erst dann Breitensport, wenn man Game-Controller mit dem mobilen Gerät nutzbar verbinden kann. Das Handy als Konsole am TV.

Ob man es bei MALI nun als "Schwäche" bezeichnet oder nicht, kann man aber IMHO erst im Vergleich zur Konkurrenz (Tegra2/3, Broadcomm, PoverVR, Adreno, etc.) richtig beurteilen. Da habe ich aber keine Ahnung. Möglicherweise kann es vielleicht in der Theorie besser gehen (wie z.B. in aktuellen Desktop-GPU-Designs), aber es wäre IMHO für eine Beurteilung als "Schwäche" auch relevant, was praktisch auf dem Markt an Alternativen existiert.

Ailuros
2012-09-03, 12:03:45
NV40 und G70 hatten im Prinzip den selben prinzipiellen Aufbau (übrigens 3dfx' Rampage auch).

Kein Wunder da Kilgariff (ex rampage leading engineer) fuer den "texturing processor" in NV40 verantwortlich war :biggrin:

http://www.beyond3d.com/content/reviews/36/9


...würde ich sagen, dass die Malis auf eine VS-Einheit beschränkt sind, die zudem noch unglücklich platziert bzw. verknüpft ist. Somit wären nach meinem Verständnis auch die Möglichkeiten der Geometrie beschränkt. Gleichzeitig steigen die Auflösungen (und damit die Grafiklast an die eigebauten GPUs) auf mobilen Geräten. 720p werden wohl in absehbarer Zeit Standard. Auf den Winz-Monitoren in mobilen Geräten ist eine nicht so aufwändige Geometrie wahrscheinlich egal, aber wenn man MALI per HDMI zum Zocken an einen TV stöpselt, kann das vielleicht auffallen, wenn die Geometrie eher grob ist.

Um es etwas klarer zu machen: es gibt eine sehr hohe Anzahl an Begrenzungen in small form factor GPUs eben weil die die area und Stromverbrauch auf minimalsten Werten bleiben muessen. Dass texturing vom shading nicht entkoppelt ist beim Mali2xx/4xx ist fuer mich persoenlich keine besondere "Suende" weiss der Geier ob in anderen mobilen GPUs es ueberhaupt eine gibt wo das texturing total entkoppelt ist.

Was jetzt die Geometrie betrifft, die Falanx/ARM Loesung in Mali ist diesbezueglich einfach schlecht balanciert; waehrend fragment cores (pixel shader ALUs) und TMUs und anderer Schnickschnack von 1 auf bis 8 skalieren, kann man an solch ein Ding stets nur eine oede Vec2 ALU haengen und aus damit. Die Frage ist halt in dem Fall was man mit einem Ueberschuss von sagen wir mal 8Vec4 PS ALUs (32 "SPs") und 8 TMUs anfangen will wenn man nur 1 Vec2 VS ALU (2 "SPs") hat.

Fuer die heutigen Verhaeltnisse in mobilen Spiele kommt ein Mali400MP4 gerade noch am Rand vorbei; fuer die zukuenftigen mobilen Spiele eben nicht wird aber fuer ARM kein besonderes Problem sein da ihre neue T6xx Generation USC ALUs hat.

In synthetischen benchmarks wie GLBenchmark2.5 oder dem neuen Basemark Dingsda, limitiert die Geometrie auf heutigen Malis ziemlich stark. Die scores sind zwar immer noch konkurrenzfaehig, aber es rangieren eben die Malis nicht mehr so hoch wie in vorigen benchmarks/

Aber das wird sicher erst dann Breitensport, wenn man Game-Controller mit dem mobilen Gerät nutzbar verbinden kann. Das Handy als Konsole am TV.

Ob man es bei MALI nun als "Schwäche" bezeichnet oder nicht, kann man aber IMHO erst im Vergleich zur Konkurrenz (Tegra2/3, Broadcomm, PoverVR, Adreno, etc.) richtig beurteilen. Da habe ich aber keine Ahnung. Möglicherweise kann es vielleicht in der Theorie besser gehen (wie z.B. in aktuellen Desktop-GPU-Designs), aber es wäre IMHO für eine Beurteilung als "Schwäche" auch relevant, was praktisch auf dem Markt an Alternativen existiert.

PowerVR SGX und Adreno2xx haben USC ALUs ergo gibt es hier verstaendlicherweise eine logische Balance zwischen vertex und pixel shading in den ALUs.

ULP GeForce Tegra2 =
1 Vec4 PS (FP20) + 1 Vec4 VS (FP32)

ULP GeForce Tegra3 =
2 Vec4 PS (FP24) + 1 Vec4 VS (FP32)

In beiden obrigen Faellen ist es um einiges ausgewohgener als bei Mali400 wo man heute an 4 Vec4 PS ALUs 1 Vec2 ALU schnallt. Vec2 ist von sich aus schon zu schwach, es waere IMHO eher Vec4 angebracht, wenn nicht gleich 2 Vec4 wenn man auf 4 fragment cores skaliert.

Die Mali TMUs sind uebrigens an die fragment cores gekoppelt und nein ich hab es nicht selber aus dem Diagramm lesen koennen, sondern es hat mir jemand damit geholfen ;)

Wie das Ganze mit dem gekoppeltem texturing laeuft wird ja oben im B3D Link fuer NV40 erklaert ;)

Bei dem Patentwesen schon nicht mehr lustig. Na immerhin sind die Ecken im Schaubild nicht rund.:freak:

Every idea worth a damn has been patented at least twice :P

Gaestle
2012-09-03, 13:09:39
Danke für die Erläuterung :)