Als Ergänzung zur englischen Version des Artikel wäre es c00l, wenn die Version, die am Ende des deutschen Artikels hängt, übersetzt würde. http://www.3dcenter.org/artikel/2004/07-30.php
BlackBirdSR
2004-09-14, 22:28:33
Als Ergänzung zur englischen Version des Artikel wäre es c00l, wenn die Version, die am Ende des deutschen Artikels hängt, übersetzt würde. http://www.3dcenter.org/artikel/2004/07-30.php
das Update am Ende?
das Update am Ende?Genau.
BlackBirdSR
2004-09-15, 00:12:52
important update, September 12th 2004
Newest insights invalidate parts of the theory in this article. We stated, that R420 is clearly slower in discarding pixels during the Z/Stencil-Pass. As a result, the whole rendering process would be slowed down. This doesn’t seem to apply as strongly as we stated. The NV40 might have a lower peak-performance when discarding pixels, but possesses finer granularity. In the end there might very well be a small advantage for the NV40. There’s also some situations where R420 can’t use its HierarchicalZ-mechanism.
Still the differences in performance per clock can’t be fully explained with just that. nVidia seems to have used optimizations in their drivers, similar to those which already helped to win Q3A benches for quite a long time now. The driver does intercept and replace CPU-demanding calls with less demanding ones. Special optimizations probably favor both, the Q3A and D3 engine. In addition, nVidia could have shown off quite some creativity in terms of replacing shaders. The company seems to have found a solution that allows for replacement of shaders without affecting image-quality.
This currently leads to the following two conclusions: First, performance in Doom3 is not as much a result of NV40 architecture as we have previously stated. Second, ATI might therefore be able to speed up Radeon based graphic cards as well. It’s possible that nVidia is able to further increase their optimization efforts though. As a result, general gaming performance can’t be attained by the means of few games representing all other games anymore. Increased performance in Doom3 for either ATI or nVidia doesn’t have to be the results of increased utilization of the respective architecture. It could be, but then again, it could just be optimizations inside the driver.
As for a general statement towards replacement of shaders: One can’t demand shaders to be executed “as they are” nowadays. In general. built-in shader optimizations, which don’t change the final visual results are always valid. It gets more complicated in terms of hand optimized techniques. Still, as long as there’s no counterproof, we assume that nVidia is only making use of things to improve performance, that have been overseen during the programming phase of the game.
Anyway, hand optimizations for any benchmark is something to take very seriously.
And Doom3 is one of the default benchmarks for almost any review out there.
wichtiges Update vom 12. September 2004:
Wir möchten den vorstehenden Artikel jetzt zumindest in Teilen entkräften. Nach neuesten Erkenntnissen ist die Theorie, dass der R420 im Z/Stencil-Pass deutlich langsamer die Pixel verwirft (wodurch das gesamte Rendering verlangsamt würde) zumindest nicht in der Härte zutreffend, wie der Artikel behauptet. Der NV40 hat zwar eine geringere Verwerf-Maximalleistung, diese aber mit feinerer Granularität als R420. Daraus könnte sich letztlich doch noch ein kleiner Vorteil für den NV40 ergeben. Außerdem gibt es weiterhin einige Situationen, in denen der R420 den HierarchicalZ-Mechanismus nicht nutzen kann.
Doch die Unterschiede in der Leistung pro Takt sind damit nicht befriedigend erklärt. nVidia scheint im Treiber "Optimierungen" ähnlicher Art vorgenommen zu haben, mit welchen nVidia seit langem alle Q3A-Benches gewinnt: Abfangen und ersetzen von CPU-lastigen Calls durch weniger CPU-lastige, bzw. spezielle Optimierungen, welche auf die Q3A- und jetzt die D3-Engine besondere Rücksicht nehmen. Zudem wird in Doom 3 kreatives Shaderreplacement betrieben: Offenbar hat nVidia eine Lösung gefunden, Alternativshader zu nutzen, ohne die Bildqualität zu beeinträchtigen.
Daraus ergeben sich zunächst zwei Schlussfolgerungen: Die Geschwindigkeit in Doom 3 ist weniger der NV40-Architektur zuzuschreiben, als wir das zunächst dargestellt haben. Zweitens ist dann vielleicht auch für Radeon-Grafikkarten noch ein Speed-Up drin. Es ist aber auch nicht auszuschließen, dass nVidia die Doom 3 Optimierung noch weiter treiben kann. Hieraus folgt dann wieder, dass man die generelle Spiele-Tauglichkeit von Grafikkarten nicht anhand weniger, "repräsentativer" Spiele festmachen kann. Bessere Leistung in Doom 3 heißt weder bei ATi noch bei Nvidia, dass damit zwangsläufig die jeweilige Hardware-Architektur besser ausgenutzt würde. Eine bessere Hardware-Ausnutzung könnte in diesem Fall vorliegen, doch vielleicht handelt es sich auch nur um Treiber-Optimierungen.
Um ein allgemeines Statement zum Shaderreplacement abzugeben: Dass der "Original-Shader" genau so ausgeführt wird, wie er ist, kann man heutzutage nicht mehr verlangen: Eingebaute allgemeine Shader-Optimierungen, welche das Resultat nicht ändern, sind prinzipiell immer zulässig. Schwierig wird es, wenn handoptimierte Verfahren genutzt werden. Doch so lange nicht das Gegenteil gezeigt wird, nehmen wir an, dass nVidia in Doom 3 "nur" Dinge zur Leistungssteigerung ausnutzt, welche bei der Programmierung des Spiels übersehen wurden. Dennoch ist Handoptimierung auf einen Benchmark (Doom 3 ist ein Quasi-Standardbenchmark) grundsätzlich kritisch zu sehen.
G00d. Habe ich mit minimalen Modifikationen an Leo geschickt.
vBulletin®, Copyright ©2000-2024, Jelsoft Enterprises Ltd.