PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Diskussion zu: nVidia kündigt den Pascal-Chip GP100 an


Leonidas
2016-04-06, 07:24:48
Link zum Artikel:
http://www.3dcenter.org/artikel/nvidia-kuendigt-den-pascal-chip-gp100

CD-LABS
2016-04-06, 08:43:29
Angenommen der GP100 wäre nun schon rein für den Einsatz in Tesla-Karten bestimmt: Was machen dann noch TMUs und ROPs auf dem Chip?
Kann mir die für irgendwas auch im wissenschaftlichen Bereich verwenden?

Falls ja, halte ich es für nahezu gegeben, dass wir den Chip nicht auf Geforce-Karten sehen werden. (und auch nicht nach Quadros, es hat mich zwar verwundert als ich das das erste Mal gehört habe, aber anscheinend braucht man auch in deren Bereich kein FP64...)

Falls nicht, wird es bedeutend weniger eindeutig...

BTW: Sichtung! http://www.computerbase.de/2016-04/nvidia-dgx-1-supercomputer-mit-8-tesla-p100-fuer-kuenstliche-intelligenz/

HPVD
2016-04-06, 10:18:56
schöne Übersicht über die verschiedenen Tesla Generationen!

Vielleicht könnte man noch die Jahreszahlen der Verfügbarkeit ergänzen - dann wäre sie noch perfekter :-)

Mortalvision
2016-04-06, 10:19:39
Vor allem die Größe des Chips finde ich erstaunlich. Wird das wieder mit Wasserkühlung wie bei FuryX gekühlt?

Godmode
2016-04-06, 10:23:01
Angenommen der GP100 wäre nun schon rein für den Einsatz in Tesla-Karten bestimmt: Was machen dann noch TMUs und ROPs auf dem Chip?
Kann mir die für irgendwas auch im wissenschaftlichen Bereich verwenden?

Falls ja, halte ich es für nahezu gegeben, dass wir den Chip nicht auf Geforce-Karten sehen werden. (und auch nicht nach Quadros, es hat mich zwar verwundert als ich das das erste Mal gehört habe, aber anscheinend braucht man auch in deren Bereich kein FP64...)

Falls nicht, wird es bedeutend weniger eindeutig...

BTW: Sichtung! http://www.computerbase.de/2016-04/nvidia-dgx-1-supercomputer-mit-8-tesla-p100-fuer-kuenstliche-intelligenz/

Die Rasterizer und Polymorphengines, die wir noch bei GM200 hatten, fehlen im aktuellen GP100 Blockschaltbild. Eventuell sitzen die TMUs so tief in den SMs, dass ein Entfernen nicht so einfach möglich war.

CD-LABS
2016-04-06, 10:57:47
Die Rasterizer und Polymorphengines, die wir noch bei GM200 hatten, fehlen im aktuellen GP100 Blockschaltbild. Eventuell sitzen die TMUs so tief in den SMs, dass ein Entfernen nicht so einfach möglich war.
Stimmt, hab ich glatt übersehen---wobei man ja ein Blockschaltbild prinzipiell so zeichnen kann, wie man gerade lustig ist, theoretisch könnten die Einheiten also trotzdem vorhanden sein, wurden aber aus (Marketing-Gründen?) weggelassen. Einen DIE-Shot hatten wir bisher ja nicht...

Godmode
2016-04-06, 11:37:13
Stimmt, hab ich glatt übersehen---wobei man ja ein Blockschaltbild prinzipiell so zeichnen kann, wie man gerade lustig ist, theoretisch könnten die Einheiten also trotzdem vorhanden sein, wurden aber aus (Marketing-Gründen?) weggelassen. Einen DIE-Shot hatten wir bisher ja nicht...

Ja bei GK110 waren die Rasterengines anfangs auch nicht eingezeichnet. Also könnte es schon sein, dass GP100 diese doch besitzt. Im Pascal Thread wird gerade was ähnliches diskutiert.

Gast
2016-04-06, 11:38:14
Link zum Artikel:
http://www.3dcenter.org/artikel/nvidia-kuendigt-den-pascal-chip-gp100
In allem was ich bislang finden konnte fehlen Angaben von nVidia zum Kontext-Switching per neuem Scheduler und damit Async Compute.... das sieht dafür momentan nicht gut aus für die Pascal-Generation.

btw bei Architektur sollte man nicht DX12 und Physix hinschreiben, letzteres hat mal garnix mit Architektur zu tun, ersteres nur sehr bedingt, je nachdem was man nun als notwendigen HW support voraussetzt oder auch nicht.... Es sind aber nunmal nur APIs, keine HW Architektur...

maximus_hertus
2016-04-06, 14:55:03
Lacht mich gerne aus, aber sind es bei 64 Clustern zu je 64 Shadern nicht 4096 Shader? Wie kommt man auf 3840?

Match-Maker
2016-04-06, 15:03:59
Das sind einfach Fehlangaben, es sind nur 60 Cluster und damit auch nur 240 TMUs.
In der Tabelle muss bei GP100 16 GB HBM2 stehen.
Tesla K40 basiert übrigens auf GK110B, nicht GK210.

CD-LABS
2016-04-06, 17:52:43
Das sind einfach Fehlangaben, es sind nur 60 Cluster und damit auch nur 240 TMUs.
In der Tabelle muss bei GP100 16 GB HBM2 stehen.
Tesla K40 basiert übrigens auf GK110B, nicht GK210.
Das erste stimmt, das zweite auch, das dritte aber nicht: Das mit den 8GiB HBM2 war voll und ganz Leos Absicht (jedenfalls interpretiere ich es so)
Kann man aber locker verzeihen, mir ist auch erst beim zweiten Mal lesen aufgefallen, dass da ein mögliche Gamer-Lösung auf GP100-Basis in der Tabelle steht...

Match-Maker
2016-04-06, 18:07:00
Das habe ich schon gesehen. ;)
Ich kann mir aber nicht vorstellen, wie sie 2017 mit nur 8 GB für die nächste Titan noch jemanden beeindrucken wollen... :freak:
(höchstens für einen non-Titan-Salvage ähnlich der GTX 980 Ti)

Leonidas
2016-04-06, 19:07:28
Das sind einfach Fehlangaben, es sind nur 60 Cluster und damit auch nur 240 TMUs.
In der Tabelle muss bei GP100 16 GB HBM2 stehen.
Tesla K40 basiert übrigens auf GK110B, nicht GK210.


1) Korrekt, wird geändert.
2) Nein, das ist eine Projektion für die Gamer-Lösung. Die wird dann vielleicht 8 GB haben. Aber okay - ich ändere das auf 8/16 GB. Stört niemanden.
3) Unsicher. Zum Release sagte man teilweise GK210 (AnandTech).



schöne Übersicht über die verschiedenen Tesla Generationen!
Vielleicht könnte man noch die Jahreszahlen der Verfügbarkeit ergänzen - dann wäre sie noch perfekter :-)


Done. Habe aber die Tesla C2075 damit gelöscht - da gleiches Releasedatum wie M2090 und damit nicht relevant.

AnarchX
2016-04-06, 19:14:12
3) Unsicher. Zum Release sagte man teilweise GK210 (AnandTech).
GK210 wurde erst mit der Tesla K80 eingeführt, mehr als ein Jahr später.
GK180 war für K40 vorgesehen, aber gecancelt, was in mancher Doku nicht mit ankam.

Leonidas
2016-04-06, 19:28:14
Ok, auch noch abgeändert in GK110B.

Gast
2016-04-06, 20:52:10
Was man in den Ganzen Tabellen nicht untergehen lassen sollte ist die Registergröße.

Ein Sprung von 6 auf 14MB ist für die Performance sicher wesentlich relevanter als die Vergrößerung des L2 von 3 auf 4 MB

Gast
2016-04-06, 20:53:37
Angenommen der GP100 wäre nun schon rein für den Einsatz in Tesla-Karten bestimmt: Was machen dann noch TMUs und ROPs auf dem Chip?

ROPs werden auch für Compute benötigt um in den Speicher zu schreiben.

CD-LABS
2016-04-06, 21:25:14
Zur DP-Effizienz in der Tabelle: Ich kann mir nicht vorstellen hoffe, dass die bei der Tesla M40 höher ausfällt und zwar aus dem einfachen Grund, dass wenn kaum etwas rechnet auch die TDP nicht ausgenutzt werden sollte.
Gibt es dazu Reviews? Die Werte in der Tabelle sehen ja bloß errechnet aus...
BTW: Bei den SP-Werten steht versehentlich bei vier der Einträgen TFlops/Watt, das wäre dann doch zu schön um wahr zu sein... :D

Leonidas
2016-04-06, 22:06:35
BTW: Bei den SP-Werten steht versehentlich bei vier der Einträgen TFlops/Watt, das wäre dann doch zu schön um wahr zu sein... :D


Gefixt.


PS: Die Werte sind natürlich errechnet. Und ja, ob die Karten ihre TDP ausnutzen, ist nicht sicher. Aber im Serverbereich gibt niemand ohne Not zu hohe TDPs an.

Gast
2016-04-07, 06:54:47
"Die Frage ist nur, ob sich dann der GP100-Chip wirtschaftlich lohnt, wenn damit nur das stückzahlenmäßig (sehr) kleine professionelle Segment bedient wird." ist schon wieder typischer 3DC-Unsinn. Als wenn nVidia nicht genug Erfahrung in dem Geschäftsbereich hätte.

So klein ist das Marktsegement eben nicht und da werden Preise bezahlt, da fällt dem gemeinen Gamer alles aus dem Gesicht.

MrSpadge
2016-04-10, 23:01:19
Gab es bei den Fermi- und Kepler-Generationen noch 192 Shader-Einheiten samt 16 TMUs pro Shader-Cluster
Nein, die Profi-Fermis (GF100, GF110) hatten 32 Shader pro SM und die Zocker-Varianten (alle anderen) 48, wovon 16 nur superskalar mit einem anderen 16'er block nutzbar waren. Kepler ist dann auf 128 + 64 superskalar hochgegangen, so dass insgesamt deutlich mehr Shader mit allerdings verringerter Auslastung auf die Chips gepasst haben.

Angenommen der GP100 wäre nun schon rein für den Einsatz in Tesla-Karten bestimmt: Was machen dann noch TMUs und ROPs auf dem Chip?
Man kann mit den TMUs linear interpolieren, was man schon häufig für table-lookups braucht. GPU-Grid nutzt das beispielsweise. Und für Quadros kann man den GP100 doch locker nehmen: sie sind teuer genug und profitieren von mehr Shadern und Bandbreite. Dass ein entsprechend der aktuellen Spekulation ausgelegter GP102 vielleicht noch besser geeignet wäre, ist ja ne andere Sache. Dann verkauft man nächstes Jahr eben noch mal ne wieder bessere Karte im 4-stelligen Preisbereich.

Und ja, ob die Karten ihre TDP ausnutzen, ist nicht sicher. Aber im Serverbereich gibt niemand ohne Not zu hohe TDPs an.
Klar tut man das nicht - man gibt aber auch keine getrennten Werte für SP und DP an. Wäre auch nicht sinnvoll, denn TDP ist immernoch die "thermal design power" und keine exakte Verbrauchsangabe. Nur weil ein Chip bei speziellen Aufgaben (Solitär?) nicht seinen normalen Verbrauch erreicht, wird das sinnvollerweise nicht extra erwähnt. Und dass bei 1/32 der SP-Leistung der Verbrauch niedriger sein muss, ist vollkommen klar - da arbeiten ja kaum noch Transistoren. Die DP-Shader sind ja seit Big-Kepler nicht auf einmal um nen Faktor 10 weniger effizient geworden.. und Kepler schmilzt unter DP-Last auch nicht weg.

MrS