PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : 9500 und HierarchialZ - ich hab da mal ne Frage


LovesuckZ
2003-01-12, 10:35:02
Da die 9500 Karten anscheinend Probleme mit dem HierarchialZ haben, stellt sich mir die Frage, ob dies ein Software- oder ein Hardwareproblem sei.
Extreme ist sich sicher, dass HierarchialZ eine Hilfe sei, besser mit der Bandbreite der Karten um zu gehen. Da die 9500 schon so gut wie moeglich beschnitten wurden, ist doch dieser Schritt von ATI, die geringe Bandbreite noch weiter zu stutzen, fragwuerdig.

Einige wuerden nun sagen, HierarchialZ bringe keine Vorteile. Diesen muss ich mit meiner 9500 widersprechen. Beim Naturetest kann man am Anfang wunderschoen sehen, dass die FPS Zahl mit HierarchialZ von 48 -> 56 ansteigen. Mit 16AF sogar von 21 ->27 hoeher gehen. Bei den anderen test des 3DMarks passiert das selbe Bild.

Und eine andere Frage: Warum arbeitet das Verfahren nicht in OpenGL? Q3 zeigt mit oder ohne HierarchialZ keine Fehler wie D3D. Auch die FPS Zahl zeigt nicht.

Naja, eigentlich will ich nur wissen, ob die probleme von HierarchialZ auch durch ein Softwareupdate zu beheben seien.

Exxtreme
2003-01-12, 11:47:13
Also HierarchicalZ dient zum Hidden Surface Removal und sorgt dafür, daß erkannte verdeckte Flächen gar nicht erst zum Rendern geschickt werden. Das spart Bandbreite und Füllrate.

Und das Abschalten von HierarchicalZ mit dem rTool hat keine Auswirkung auf OpenGL und zeigt deswegen nur unter D3D Wirkung. Und deswegen ändern sich die Frameraten unter OpenGL nicht. ;)

Und ob das ein HW-Problem oder ein Treiberproblem ist, das kann ich leider nicht sagen.

Demirug
2003-01-12, 12:08:54
Da hätte ich jetzt auch noch eine Frage.

Ist HierarchicalZ und das Early-Z einzeln abschaltbar, oder immer nur beides zusammen?

Exxtreme
2003-01-12, 12:40:09
Originally posted by Demirug
Da hätte ich jetzt auch noch eine Frage.

Ist HierarchicalZ und das Early-Z einzeln abschaltbar, oder immer nur beides zusammen?
Weiss ich leider nicht. Es gibt einen Registrywert namens "HierarchicalZEnable" und damit kann man es ein- und ausschalten. Ob Early-Z mitabgeschaltet wird oder nicht, das weiss ich leider nicht. Und die Fuzzies von Dev-Support halten sich mit sowas sehr bedeckt.

P.S. Vielleicht hast du mehr Glück.

Demirug
2003-01-12, 12:47:08
Keine Lust mich jetzt mit dem Dev-Support rumzuärgern. Du könntest ja mal meinen Overdraw Test mit und ohne "HierarchicalZ" laufen lassen.

http://demirug.bei.t-online.de/ZOverdraw.zip

ow
2003-01-12, 12:50:33
Apropos Overdraw:
Thomas´ Tester scheint irgendwie niemand richtig zu interessiren (http://www.forum-3dcenter.org/vbulletin/showthread.php?s=&threadid=44301), ich weiss immer noch nicht, wie man die gemessenen Pixel/s etc. interpretiert.:D

Exxtreme
2003-01-12, 12:56:16
Originally posted by Demirug
Keine Lust mich jetzt mit dem Dev-Support rumzuärgern. Du könntest ja mal meinen Overdraw Test mit und ohne "HierarchicalZ" laufen lassen.

http://demirug.bei.t-online.de/ZOverdraw.zip
Welche Tests willste denn haben?

Demirug
2003-01-12, 13:02:46
Originally posted by Exxtreme

Welche Tests willste denn haben?

Wenn es nicht zuviel arbeit macht.

8 Texturen 64 Overdraw F2B mit HierarchicalZ
8 Texturen 64 Overdraw B2F mit HierarchicalZ
8 Texturen 64 Overdraw F2B ohne HierarchicalZ
8 Texturen 64 Overdraw B2F ohne HierarchicalZ

Das sollte eigentlich reichen um eine Aussage machen zu können.

Demirug
2003-01-12, 13:09:55
Originally posted by ow
Apropos Overdraw:
Thomas´ Tester scheint irgendwie niemand richtig zu interessiren (http://www.forum-3dcenter.org/vbulletin/showthread.php?s=&threadid=44301), ich weiss immer noch nicht, wie man die gemessenen Pixel/s etc. interpretiert.:D

ow, ich würde ja gerne was dazu sagen aber da ich nicht so genau weiss was denn da nun intern genau abläuft tuhe ich mir da etwas schwer. Deswegen müsste Thomas da was dazu sagen.

LovesuckZ
2003-01-12, 13:11:31
Originally posted by Demirug
8 Texturen 64 Overdraw F2B mit HierarchicalZ

AVG. Fillrate ca. 5800 MPixel

Texturen 64 Overdraw B2F mit HierarchicalZ

Avg. ca. 200 MPixel

8 Texturen 64 Overdraw F2B ohne HierarchicalZ

Avg. ca. 1030

8 Texturen 64 Overdraw B2F ohne HierarchicalZ


Avg. ca. 200

Karte: Radeon 9500 398C/303S

Exxtreme
2003-01-12, 13:30:54
Originally posted by Demirug


Wenn es nicht zuviel arbeit macht.

8 Texturen 64 Overdraw F2B mit HierarchicalZ
8 Texturen 64 Overdraw B2F mit HierarchicalZ
8 Texturen 64 Overdraw F2B ohne HierarchicalZ
8 Texturen 64 Overdraw B2F ohne HierarchicalZ

Das sollte eigentlich reichen um eine Aussage machen zu können.
OK, hier die Werte:

1024x768x32 Radeon 9700 @ 325/310MHz

| HierarchicalZ | Rendering | FPS | MPix | MTex |
| ON | FTB | 262,12 | 13193 | 105543 |
| ON | BTF | 6,42 | 323,2 | 2585,5 |
| OFF | FTB | 45,3 | 2281,7 | 18253 |
| OFF | BTF | 6,42 | 323,2 | 2586,2 |

Hoffe das hilft.

ow
2003-01-12, 13:41:12
Originally posted by Demirug


ow, ich würde ja gerne was dazu sagen aber da ich nicht so genau weiss was denn da nun intern genau abläuft tuhe ich mir da etwas schwer. Deswegen müsste Thomas da was dazu sagen.

Schade, ich dachte halt du könntest mit dieser D3D_Occlussion...-Funktion was anfangen, die diese Pixel/s-Werte ermittelt.

ow
2003-01-12, 13:42:48
Originally posted by Exxtreme

OK, hier die Werte:

1024x768x32 Radeon 9700 @ 325/310MHz

| HierarchicalZ | Rendering | FPS | MPix | MTex |
| ON | FTB | 262,12 | 13193 | 105543 |
| ON | BTF | 6,42 | 323,2 | 2585,5 |
| OFF | FTB | 45,3 | 2281,7 | 18253 |
| OFF | BTF | 6,42 | 323,2 | 2586,2 |

Hoffe das hilft.

Jo, HierarchicalZ funzt (zu sehen an den FTB-Werten, BTF kann es ja nicht wirken, deshalb da kein Unterschied mit/ohne Hier..Z).


/edit: Und early Z wirkt auch ohne HierachicalZ (an Hier..Z off und FTB vs. BTF zu erkennen imo)

Demirug
2003-01-12, 13:46:40
ja ow, und zusätzlich kann man daraus noch folgendes ableiten.

-HierarchicalZEnable deativiert nicht das Early-Z.
-HierarchicalZ spart nicht nur bandbreite sondern auch fillrate.

Demirug
2003-01-12, 13:51:21
Originally posted by ow


Schade, ich dachte halt du könntest mit dieser D3D_Occlussion...-Funktion was anfangen, die diese Pixel/s-Werte ermittelt.

Was die Funktion macht kann ich dir schon sagen. Mann ermittelt damit wie viele Pixel den Z-Test überleben. Wenn man allerdings die effektivität der Early-Z Einheiten ermitteln möchte muss man auch wissen wie viele Pixel es vor dem z-Test wahren.

ow
2003-01-12, 13:51:30
Originally posted by Demirug
ja ow, und zusätzlich kann man daraus noch folgendes ableiten.

-HierarchicalZEnable deativiert nicht das Early-Z.
-HierarchicalZ spart nicht nur bandbreite sondern auch fillrate.

s.o. hab´s gerade noch editet

btw. mein GF4ti4200 Werte, selbe Einstellungen aber nur 4 Texturen (Limit der GF4):


FTB & BTF identisch! :

9,59 fps 482,5 Mpix 1930 MTex

update
diese Werte waren mit VSync auf 'app controlled', demi, kannst du nicht mit deinem Test VSyncOff erzwingen?

ohne Vsync: 9,90 fps 497,5 Mpix/s 1991 Mtex/s

(macht ja bei derart niedrigen fps aum was aus, ob mit oder ohne VSync)
/update

Originally posted by Demirug


Was die Funktion macht kann ich dir schon sagen. Mann ermittelt damit wie viele Pixel den Z-Test überleben. Wenn man allerdings die effektivität der Early-Z Einheiten ermitteln möchte muss man auch wissen wie viele Pixel es vor dem z-Test wahren.


Thx:) Jetzt bin ich schon mal schlauer als vorher.
Kann man nicht aus dem Vergleich BTF vs. FTB dann die Effizienz ermitteln?

Demirug
2003-01-12, 14:05:52
Originally posted by ow


s.o. hab´s gerade noch editet

btw. mein GF4ti4200 Werte, selbe Einstellungen aber nur 4 Texturen (Limit der GF4):


FTB & BTF identisch! :

9,59 fps 482,5Mpix 1930 MTex

Ja das Early-Z auf einem NV25 keine Fillrate spart haben wir inzwischen ja festgestellt.

Thx:) Jetzt bin ich schon mal schlauer als vorher.
Kann man nicht aus dem Vergleich BTF vs. FTB dann die Effizienz ermitteln?

Ja und nein. Da sich ja leider beim B2F zum F2B auch die FPS ändert sind die Zahlen nicht direkt zu vergleichen. Mit ein bischen Aufwand müsste man es aber eventl. rausrechnen können.

Edit: Zum VSync. Schande über mich ich dachte der wäre aus. Werde ich ändern. Dauert aber bis morgen da ich die Codebasis hier nicht zur Hand habe.

ow
2003-01-12, 14:26:26
Originally posted by Demirug

Ja und nein. Da sich ja leider beim B2F zum F2B auch die FPS ändert sind die Zahlen nicht direkt zu vergleichen.


Hmm.... also wie bei deinem Overdraw-Test tut sich da bei Thomas Test nicht wirklich viel bei den fps BTF vs. BTF, wie du an meinen im Thread geposteten Ergebnissen sehen kannst.

Das sind FTB keine 10% mehr fps als BTF (EInstellungen s. im Thread).

LovesuckZ
2003-01-12, 15:02:54
Originally posted by Exxtreme
Und das Abschalten von HierarchicalZ mit dem rTool hat keine Auswirkung auf OpenGL und zeigt deswegen nur unter D3D Wirkung. Und deswegen ändern sich die Frameraten unter OpenGL nicht. ;)


Gibt es unter OpenGL nicht so einen Befehl?

Exxtreme
2003-01-12, 20:01:59
Originally posted by LovesuckZ


Gibt es unter OpenGL nicht so einen Befehl?
Nein, den gibt es nicht. Ich habe schon die ganzen Treiber-Dateien danach abgesucht.

Quasar
2003-01-12, 21:57:19
Habe leider den ganzen Tag Tech-Support leisten müssen (Naja, TS für Ober-DAUs), bin deswegen leider nicht zum Testen gekommen. Ich bau gleich mal das Sys mit der R9500 wieder auf....

LovesuckZ
2003-01-12, 22:22:31
Ich hab mal ne andere Frage wegem dem Fillrate test von 3DMark.
Wenn ich meine Karte auf 398 Core und 303 Speichertakt hochdrehe, veraendern sich beim zuschalten von AF nicht die Werte bei dem test. Egal ob ich mit 2,4,8 oder 16 fahre. Einzig allein der ST Test geht ein winziges bisschen runter. Der Mt Test bleibt gleich.
Ist das normal?

Exxtreme
2003-01-12, 23:43:21
Originally posted by LovesuckZ
Ich hab mal ne andere Frage wegem dem Fillrate test von 3DMark.
Wenn ich meine Karte auf 398 Core und 303 Speichertakt hochdrehe, veraendern sich beim zuschalten von AF nicht die Werte bei dem test. Egal ob ich mit 2,4,8 oder 16 fahre. Einzig allein der ST Test geht ein winziges bisschen runter. Der Mt Test bleibt gleich.
Ist das normal?
Naja, wie in einem anderen Thread schon quasi bewiesen, ist der Fillrate-Test von 3DMurks eher als ein Bandbreitentest anzusehen und weniger als ein Fillratetest.

LovesuckZ
2003-01-13, 18:35:02
Hm, kann es auch sein, dass HierarchialZ nur mit 8 Pipes richtig funktioniert? wenn ich den Softmod machen, dann hab ich zwar nen schoenes Schachbrett, aber die Fehler beim HierarchialZ on sind weg...

Demirug
2003-01-13, 19:06:52
Originally posted by LovesuckZ
Hm, kann es auch sein, dass HierarchialZ nur mit 8 Pipes richtig funktioniert? wenn ich den Softmod machen, dann hab ich zwar nen schoenes Schachbrett, aber die Fehler beim HierarchialZ on sind weg...

Welche Fehler beim HierarchialZ?

Und könntest du mal ein Shot von dem Schachbrett machen? Ich würde gernen mal sehen wie das aussieht.

LovesuckZ
2003-01-13, 19:10:17
Originally posted by Demirug
Welche Fehler beim HierarchialZ?

Diese fehler (http://www.forum-3dcenter.org/vbulletin/showthread.php?s=&postid=619832#post619832) (auf dem Bild) sind weg.

Und könntest du mal ein Shot von dem Schachbrett machen? Ich würde gernen mal sehen wie das aussieht.

Schaff ich heut leider nicht mehr. Tut mir leid.

Demirug
2003-01-13, 19:31:10
LovesuckZ: Keine Hektik das ist wirklich nicht wichtig.

ow
2003-01-13, 20:23:13
Originally posted by LovesuckZ


Diese Fehler (http://www.forum-3dcenter.org/vbulletin/report.php?s=&postid=619832) (auf dem Bild) sind weg.



Schaff ich heut leider nicht mehr. Tut mir leid.


Haste deinen Link mal probiert?;)

Nimm den hier:

http://www.forum-3dcenter.org/vbulletin/showthread.php?s=&postid=619832#post619832

LovesuckZ
2003-01-13, 20:35:42
Originally posted by ow
Haste deinen Link mal probiert?;)


Danke

Leonidas @ Testrechner
2003-01-14, 00:41:18
Ich kann die Fehler bei der 9500 bestätigen (bei mir nur in C4). Nach Deaktivierung von HZ sind diese weg.

LovesuckZ
2003-01-14, 15:40:40
Originally posted by Leonidas @ Testrechner
Ich kann die Fehler bei der 9500 bestätigen (bei mir nur in C4). Nach Deaktivierung von HZ sind diese weg.

ollix hatte die selben Probs. Er hatte ne 128MB 9500. Der Fehler liegt ganz eindeutig an den 4 Pipe's.

Exxtreme
2003-01-14, 16:48:58
Originally posted by LovesuckZ


ollix hatte die selben Probs. Er hatte ne 128MB 9500. Der Fehler liegt ganz eindeutig an den 4 Pipe's.
Es muss nicht unbedingt an den Pipes liegen. Es kann auch andere Gründe haben.

LovesuckZ
2003-01-14, 16:55:38
Originally posted by Exxtreme
Es muss nicht unbedingt an den Pipes liegen. Es kann auch andere Gründe haben.

Das denke ich nicht. Wenn ich en Softwaremod mache, sind die HZ (1)Fehler weg.

Ikon
2003-01-18, 03:24:24
Originally posted by LovesuckZ
Das denke ich nicht. Wenn ich en Softwaremod mache, sind die HZ (1)Fehler weg.

Wenn das so ist, dann könnte es sich durchaus um einen Treiberbug im R9500-Teil des Catalysts handeln.

Ikon
2003-01-18, 18:45:17
???

robbitop
2003-01-25, 07:19:15
wenn also der 3DMark FR Test ein Bandbreiten Test ist, warum hat man nach dem R9500@R9700 MOD doppelt sohohe Werte?

Und die R9500PRO hat AFAIK auch 2x So hohe Werte wie die 9500.

Bisher sollte es so sein
9500 nonPRO 128MB : 256bitDDR (stimmt das oder nicht??)
9500PRO : 128bit DDR
9700 : 256bit DDR

btw
wie könnte ich nachweisen, was für ein DDR Interface meine R9500 hat???
überall brechen in D3D @1024 die FPS bei Default->4xAA um 30% ein.
Speicher OC bringt nix, chip OC bringt fast lineare steigerung.

Wäre nett wenn ein R9500 64MB User das mal testen würde, wieviel bei 4xFSAA @UT 2k3 ein RAM overclocking bringt..meinetwegen nur 10% mehr RAM Takt und gleichen Chiptakt...

Demirug
2003-01-25, 09:50:13
Originally posted by robbitop
wenn also der 3DMark FR Test ein Bandbreiten Test ist, warum hat man nach dem R9500@R9700 MOD doppelt sohohe Werte?

Und die R9500PRO hat AFAIK auch 2x So hohe Werte wie die 9500.

Bisher sollte es so sein
9500 nonPRO 128MB : 256bitDDR (stimmt das oder nicht??)
9500PRO : 128bit DDR
9700 : 256bit DDR

btw
wie könnte ich nachweisen, was für ein DDR Interface meine R9500 hat???
überall brechen in D3D @1024 die FPS bei Default->4xAA um 30% ein.
Speicher OC bringt nix, chip OC bringt fast lineare steigerung.

Wäre nett wenn ein R9500 64MB User das mal testen würde, wieviel bei 4xFSAA @UT 2k3 ein RAM overclocking bringt..meinetwegen nur 10% mehr RAM Takt und gleichen Chiptakt...

Der Fillratetest vom 3dmark ist schon ein Fillratetest nur bei den meisten Karten limitiert gerade beim Singletexturing die Bandbreite vor der Fillrate. Die 9500 mit 128 MB hat aber nun aufgrund des 256 Bit Interfaces soviel Bandbreite das hier mal wirklich die Fillrate limitiert und deshalb nach dem Mod noch eine Steigerung möglich ist.

LovesuckZ
2003-01-25, 14:07:55
Originally posted by robbitop
wenn also der 3DMark FR Test ein Bandbreiten Test ist, warum hat man nach dem R9500@R9700 MOD doppelt sohohe Werte?


Mit einen Core von 391 hatte ich im St Test 1024 und im MT ein Wert von 1500.

Bei diesem hohen Coretakt bringt eine Uebertaktung des Speichers verdammt viel. Vorallen in Nature und Dragothic.