|
Community Links |
Interessengemeinschaften |
Benutzerliste |
Foren durchsuchen |
Stichwortsuche |
Erweiterte Suche |
Uns unterstützen |
Shoppen bei Amazon |
Spende per Patreon |
Spende per PayPal |
Spende per Steady |
alle Möglichkeiten |
Gehe zu... |
![]() |
|
Themen-Optionen
![]() |
Ansicht
![]() |
![]() |
#101 (im Thread / einzeln) |
Hardcore Member
Registriert: 2011-12-15
Beiträge: 1.802
|
Re: DG3 "Battlemage" (Xe2-HPG, Arc B-Series, 2024)
![]() Und es ist so, Grafikkarten skalieren jetzt nicht so dolle mit Cache. Die Datenmengen sind da viel zu groß und das bedeutet sehr viele Cache-Misses. Wir reden im Fall von DG3-448 laut RGT von 20Gbps @ 192bit, während DG2-512 16Gbps@256bit hatte. D.h. die VRAM-Bandbreite ginge leicht zurück, obwohl man ca. doppelte Performance zum Vorgänger anpeilte. Anders als über einen großen Cache sehe ich nicht, wie das gehen sollte. Es sei denn, das SI von ALC-G10 war völlig überdimensioniert für dessen Bandbreitenbedarf, aber dann wäre die Frage, warum sie nicht schon dort auf 192bit gesetzt haben. Das impliziert, dass Intel bei Dingen wie DeltaColorCompression usw. noch nicht so weit wie NV und inzwischen auch AMD ist, und deshalb breitere SIs und/oder größere Caches braucht.
Haupt-Rechner: R5 3600 @stock, Asrock AB350 Pro4, 2x8GB DDR4-3200/16-16-16-38, RTX 3060 Ti UV@~1.6Ghz/0.8V, 1x256GB (Sys) & 1x512GB (Games) Samsung 850 EVO je mit max. Overprovisioning, 1x 2TB 970 EVO Plus, be quiet! PurePower10 500W CM, Win10x64
|
![]() ![]() |
![]() ![]() |
![]() |
#102 (im Thread / einzeln) |
Moderator & 3D-Guru
Registriert: 2001-08-19
Ort: Baden-Württemberg
Beiträge: 47.984
|
Re: DG3 "Battlemage" (Xe2-HPG, Arc B-Series, 2024)
![]() Also bei AMD seit RDNA2 und Nvidia seit Ada müssen die L2/IF-Caches schon ne Menge bringen, sonst würden sie mit so schmalen SIs nicht diese Performance-Steigerungen erreichen, da bei DCC etc. langsam das Ende der Fahnenstange erreicht ist. ![]()
"Der Akt, durch den ein Individuum seiner Güter beraubt wird, heisst Raub, wenn ihn ein anderes Individuum begeht. Und soziale Gerechtigkeit, wenn eine ganze Gruppe plündert" - Nicolas Gomez Davila
"Die perfekte Gleichheit liegt nur im Tod. Deshalb ist der Genozid die Lieblingsbeschäftigung der Gleichmacher." - Roland Baader "Es ist egal, ob die Wissenschaft der globalen Erwärmung komplett an den Haaren herbeigezogen ist, gibt uns der Klimawandel doch die größte Möglichkeit Gerechtigkeit und Gleichheit in die Welt zu tragen." Christine Stewart "Nimm das Recht weg – was ist dann ein Staat noch anderes als eine große Räuberbande" - Heiliger Augustinus "Socialists cry "Power to the people", and raise the clenched fist as they say it. We all know what they really mean—power over people, power to the State." - Margaret Thatcher Ich ziehe es vor, meine Kenntnisse aus den autorisierten Informationen unserer Regierung zu beziehen. - Klima"wissenschaft" in Action |
![]() ![]() |
![]() ![]() |
![]() |
#103 (im Thread / einzeln) |
Master Member
Registriert: 2013-11-25
Beiträge: 8.751
|
Re: DG3 "Battlemage" (Xe2-HPG, Arc B-Series, 2024)
![]() Wir reden im Fall von DG3-448 laut RGT von 20Gbps @ 192bit, während DG2-512 16Gbps@256bit hatte. Alles in allem: 4070 Performance, 4070 Speicherbandbreite, 250mm2 in N4 sieht für mich recht gut aus. PPA etwa auf Lovelace Niveau (falls DG3-448 bei ~200W landen sollte) inkl. starken RT-Cores und Matrix-Units. Klar, das ist 2 Jahre nach Lovelace. Aber "Technologie normiert" sieht das nicht schlecht aus. Geändert von basix (2024-01-15 um 15:27:44 Uhr) |
![]() ![]() |
![]() ![]() |
![]() |
#104 (im Thread / einzeln) |
Master Member
Registriert: 2007-05-07
Ort: Düsseldorf
Beiträge: 7.542
|
Re: DG3 "Battlemage" (Xe2-HPG, Arc B-Series, 2024)
![]() Habe ich eigentlich die ganze Zeit etwas verpasst? 512 MiB Cache, stand das schon mal irgendwo? Und WTF? Folgt man den Ausführungen von AMD und Nvidia, wäre das ziemliche Verschwendung - es sei denn, man kann den Cache aus unbekannten Gründen schön klein, billig und ohne Fehler fertigen. ![]() Wenn intessieren denn die 20% Marktanteil von AMD, man muss was von den 80% von NV bekommen. |
![]() ![]() |
![]() ![]() |
![]() |
#106 (im Thread / einzeln) |
Admiral Member
Registriert: 2008-03-14
Beiträge: 3.746
|
Re: DG3 "Battlemage" (Xe2-HPG, Arc B-Series, 2024)
![]() Die Specs sind aus dem oben verlinkten RGT-Video. Auf den zweiten Blick sehen 192bit mit 8MB L2 und 512MB L3 aber schräg aus. Und ja, 512MB wäre absoluter Overkill. Bevor man die Karte zieht, hätte man doch das SI wenigstens wieder auf 256bit angehoben, weil die "Bandbreite pro mm²" da viel höher sein dürfte bei dem aktuellen Verhältnis Geändert von AffenJack (2024-01-15 um 16:36:35 Uhr) |
![]() |
![]() ![]() |
![]() |
#107 (im Thread / einzeln) |
Gold Member
Registriert: 2004-12-11
Beiträge: 820
|
Re: DG3 "Battlemage" (Xe2-HPG, Arc B-Series, 2024)
https://twitter.com/harukaze5719/sta...38266922151993
Schade, dass man zu dem BGA2727-BMG kein Bild sieht. BGA2362-BMG ist aber eigentlich ein BGA482(482 balls) Frage an diejenigen, die eine Alchemist Graka gekauft haben: Hatte schon irgendjemand einen Garantiefall oder Graka blöde/unerwartet abgeraucht?
O say, does that star-spangled banner yet wave
O'er the land of the free And the home of the brave? ![]() Geändert von mocad_tom (2024-01-15 um 19:38:50 Uhr) |
![]() |
![]() ![]() |
![]() |
#108 (im Thread / einzeln) |
Master Member
Registriert: 2012-10-05
Ort: Bayern -> Schwaben -> "Datschiburg"
Beiträge: 8.671
|
Re: DG3 "Battlemage" (Xe2-HPG, Arc B-Series, 2024)
![]() Frage an diejenigen, die eine Alchemist Graka gekauft haben:
Gaming System:
Core i5 13500, 2x 16GB DDR5, ASRock B760M Steel Legend, Intel Arc B580 Limited Edition |
![]() ![]() |
![]() ![]() |
![]() |
#109 (im Thread / einzeln) |
Admiral Member
|
Re: DG3 "Battlemage" (Xe2-HPG, Arc B-Series, 2024)
![]() Habe ich eigentlich die ganze Zeit etwas verpasst? 512 MiB Cache, stand das schon mal irgendwo? Und WTF? Folgt man den Ausführungen von AMD und Nvidia, wäre das ziemliche Verschwendung - es sei denn, man kann den Cache aus unbekannten Gründen schön klein, billig und ohne Fehler fertigen. 14nm hat 0.050µm großen SRAM und Intel7 0.031µm (6T HCC). Da die Fabs schon abgeschrieben sind, dürften die Kapazitäten entsprechend günstig verfügbar sein. Ohne Ansteuerungslogik (+ 30-50%) sind selbst in 14nm gute 16mb/mm2 möglich. 512MB in unter 100mm2 wäre also kein Problem. Oder man reduziert analog zum 22FFL Spezialprozess von lakefield zusätzlich die Anzahl an Layern und Steps und setzt stattdessen auf einen größeren Base-DIE. Auch würde es wohl Sinn machen das SI in den ADM base-DIE zu packen. Das würde aber bedeuten dass Battlemage eine Multichip GPU oder Foveros / advanced stacking, 3d der 2.5D GPU ist. Das wundert mich dann schon dass wir davon bisher nichts gehört haben. Ich räume dem Gerücht also nur geringe Chancen ein. ![]() Es sei denn, das SI von ALC-G10 war völlig überdimensioniert für dessen Bandbreitenbedarf, aber dann wäre die Frage, warum sie nicht schon dort auf 192bit gesetzt haben. Intel hat Latenzprobleme auf beinahe jeder Cache-Stufe. Der L1 ist zwar vergleichweise groß, aber hat auch die doppelte Latenz von AMD oder Nvidia, zudem hat AMD zusätzlich noch den noch Latenzärmeren L0 davor. Der Grund für die Notwendigkeit des großen L1 jedes XE Cores ist die vergleichsweise langsame Anbindung an den globalen L2, der von Bandbreite und Latenz eher mit AMDs RDNA2 Infinity cache vergleichbar ist der wiederum 8x so groß ist. RDNA2 ist bei der Speicherhierachie einfach eine ganz andere Generation. Der Fokus auf den L1 ist eine Gemeinsamkeit mit der verwandten XE Architektur bei Ponte Vecchio, die sogar 512kb L1 pro Core hat (vmtl. wegen Fullrate FP64) aber direkt dahinter nur sehr lahme Off-DIE Verbindungen von 230Gb/s für 8XE Cores. Da der L2 bei ARC ja der LLC ist, kann man den eher mit dem L3 bei AMD und Nvidia vergleichen. 16MB sind dafür also nicht besonders groß gegenüber 72MB, 96MB und 128mb. Last but not least ist die VRAM-Latenz Katastrophal mit fast 400ns. Das ist Datacenter Level, wo niedrigere Taktraten und HBM mit hohen Latenzen üblich ist und noch parallelere Workloads laufen als Spiele. Navi31 hat eher etwas bei 280ns trotz Die to Die Interconnect, N21 hat 260ns und GA102 liegt bei 230ns. Das ist umso verwunderlicher, als dass AMD und NV ja eine Cache Stufe mehr haben und daher die deutlich höheren VRAM Latenzen haben müssten. Zudem kriegt man den Speichercontroller nur sehr schwer ausgelastet, da anscheinend die Crossbar bzw. Verbindung der einzelnen XE_Cores zum SI unterdimensioniert sind. Ein XE-Core kriegt laut Chips and Cheese nur rund 8gb/s durch, ein RDNA2 WGP kommt auf 63gb/s und ein Ampere SM auf 34gb/s. Selbst GCN1.0 war schon um Größenordnungen besser pro CU. Eine volle Auslastung der theoretischen Bandbreite des 256bit Interfaces ist also nur bei perfekt symmetrischen Lasten, hoher Workgroup Size möglich. Das ist eine enorme Aufgabe an den Compiler und deswegen ist Software für Intel auch so ein großes Problem. Das liegt an den getroffenen Hardware-Entscheidungen. Man hätte stattdessen auch Hardware bauen können die eine bessere Auslastung erreicht, dafür aber weniger theoretischen Durchsatz bietet und sich nicht so gut durch bessere Compiler beschleunigen lässt (und damit weniger mit der Datacenter Architektur gemeinsam hat). Ein einfacher Trick um höhere Workgroup Sizes zu ermöglichen ist die Renderauflösung zu erhöhen. Daher skaliert Arc auch so gut in 4K und umgekehrt sind die kleinen IGPs eher schneller als der viermal so große ACM-G10 Chip erwarten lassen würde. Der Compiler liefert halt ähnliche Threadanzahlen an die kleinen IGPs aus wie an die großen dGPUs. Die Partitionierung von DG2 mit riesigen Lücken zwischen L1 und L2 und schlechter Anbindung der einzelnen XE-Cores wirkt so als wenn hier aus praktischen Gründen viel von der Chiplet-GPU übernommen wurde. AMD ist dasselbe Spiel damals mit GCN eingegangen, also enorm vorzulegen bei Compute und darauf zu hoffen dass man die Auslastung im Laufe der Jahre durch compute-lastige Workloads und bessere Compiler in den Griff bekomt. Nvidia hat das ignoriert und bei Maxwell und Turing die Hardwareauslastung auch bei kleineren Workgroup sizes optimiert. Es gab also wenig Grund für den herbeigesehnten Paradigmenwechsel in der Software angesichts Nvidias großer Marktmacht. Spiele-Workloads haben häufig threads die von mehr Ressourcen pro Core/WGP/SM profitieren und sind daher selten total symmetrisch. DG2 klingt eher nach einer Compute GPU. Auch wenn die XE Cores total anders sind erinnern mich die Limitierungen viel an GCN. Auch GCN war nur bei sehr hoher Workgroup-Size auszulasten. ![]() Entweder war das Speicherinterface bei Alchemist überdimensioniert oder Battlemage macht einen grossen Sprung vorwärts bei der Bandbreiteneffizienz. Der GDDR6 Speichercontroller und die Crossbar sowie das interne fabric sind auf jeden Fall totaler Schrott und Intel wird für BGM definitiv eine andere, potentere IP verwenden. Dann reicht auch ein 192bit Interface. Sobald das Problem mit low occupancy workloads gelöst ist dürften das nicht nur bei der Bandbreitenskalierung sondern auch bei den XE-Cores ein paar Handbremsen lösen. Geändert von davidzo (2024-01-16 um 15:52:11 Uhr) |
![]() |
![]() ![]() |
![]() |
#110 (im Thread / einzeln) |
Gold Member
Registriert: 2016-07-08
Beiträge: 861
|
Re: DG3 "Battlemage" (Xe2-HPG, Arc B-Series, 2024)
![]() Intel wäre froh, wenn sie die 20% hätten. An Nvidia kommen sich technisch so schnell nicht dran, keine Chance. Worst-case: beide müssen den Markt gleichzeitig aufgeben, weil Entwicklungskosten mit 10% Marktanteil nicht gedeckt werden können und NV massig Geld für F&E hat. Also ich sehe für niemanden (Kunden, AMD, Intel) ein gutes Szenario außer für NV... Nur wenn NV Marktanteil schrumpft wird es Innovationen und einen gesunden Markt geben. |
![]() |
![]() ![]() |
![]() |
#111 (im Thread / einzeln) |
Admiral Member
|
Re: DG3 "Battlemage" (Xe2-HPG, Arc B-Series, 2024)
Naja, AMD hat erstmal mit dem Konsolengeschäft einen Fuß in der Gaming-Tür und scheint bei den entry level GPUs auch die deutlich belastbarerer Kostenstruktur zu haben als Intel. Siehe RX7600 vs ARC A770 16G, die in der gleichen Leistungsklasse liegen, letztere aber in der Herstellung fast doppelt so teuer sein dürfte.
Verschwinden wird AMD also nicht, eher ist es so das Intel weiter bluten muss sollten sie einen Preiskrieg anzetteln. Zudem konzentriert sich AMDs GPU Division derzeit mit Absicht erstmal auf den AI Markt, weil margenträchtiger. Ich sehe kein Problem wieso AMD nicht die Ressourcen haben sollte nochmal einen RDNA-Moment zu produzieren sobald man mit dem Fokus auf den AI Markt durch ist. Für Intel macht es natürlich Sinn erstmal nur den Entry bis maximal Midrange abzudecken. Nvidia vernachlässigt das Entrylevel Segment sowieso sträflich, insofern kann man im Sub-250€ Markt echt gut wildern. Bei Performance- und Enthusiast Chips ist die Konkurrenz durch Nvidia und AMD zu hart. Nvidia hat letztendlich eine Kostenstruktur die mit jeden Preiskämpfen mitgehen könnte, aber meistens nichtmal muss, denn man dominiert AMD auch so, einfach durch die hohe Brand-recognition. Schon bei DG2 gleich zwei Chips zu bringen war imo nicht unbedingt notwendig. ACM-G11 ist eh zu nah dran an den IGPs gewesen. Ein Chip in der Mitte dazwischen mit 128bit und 16XE-Cores hätte es wohl auch getan um einen ähnlichen Marktanteil zu bekommen. Sub 200€ gibt es auch nichts anständiges von AMD, da wäre also die Nische gewesen. Sich mit der 4070 anzulegen ist ein ehres Ziel, aber Kostentechnisch wäre man wohl besser beraten sich die 4060 und 7600 (XT) als Gegner auszusuchen. Die haben ja beide so ihre Schwächen. Navi33 durch das schmale SI, begrenzte Effizienz und begrenzte Taktraten/Rechenleistung und AD107 durch die kleine Ansetzung des Chips. Nvidia hat dafür noch AD106 in der Hinterhand, aber soviel größer ist der auch nicht. Ich würde es tatsächlich bevorzugen wenn Intel BMG erstmal in diesem Marktbereich launcht, ohne teuren schnickschnack wie ADM interposer und so. Da würden erneut 32XE Kernen reichen, mit gefixter Speicherhierachie und 192bit SI höherem Takt und verbessertem Energieverbrauch sowie gesenkten Herstellungskosten. Insgesamt +50% Leistung wäre imo schon drin, wenn Intel die Fabric-Handbremsen löst, wir einen großen on-DIE Cache bekommen und die Taktraten um 25% auf rund 2,8Ghz gesteigert werden können. ![]() Worst-case: beide müssen den Markt gleichzeitig aufgeben, weil Entwicklungskosten mit 10% Marktanteil nicht gedeckt werden können und NV massig Geld für F&E hat. Hat Intel auch sehr lange so gemacht und mit Cascade-Lake X, Cooperlake etc. weiterhin Gewinne eingefahren obwohl EPYC Rome und Milan billiger verfügbar waren und AMD an Marktanteilen aufholte. Mit dem Unterschied dass Nvidia die nächste überlegene µArch in der Hinterhand hat und keinen Fertigungsnachteil, also ohne Risiko. Geändert von davidzo (2024-01-16 um 18:30:55 Uhr) |
![]() |
![]() ![]() |
![]() |
#112 (im Thread / einzeln) |
Hardcore Member
Registriert: 2021-08-09
Beiträge: 1.504
|
Re: DG3 "Battlemage" (Xe2-HPG, Arc B-Series, 2024)
MLID hat ein neues Video gepostet, diesmal mit angeblichen Dokumenten (von dem einiges geschwärzt ist). Zusammenfassung auf Videocardz.
Demnach wäre Battlemage für mobile gestrichen. Für Desktop sollen aber alle GPUs gelistet sein zwischen Q4 2024 - Q1 2025. MLID macht ein großes Drama draus, weil mobile gestrichen wurde. Finde ich jetzt relativ egal solange die Desktop Karten kommen. Alchemist mobile dGPU war kaum präsent und auch AMD ist kaum präsent im dGPU Markt für laptops. Das dürfte die wenigsten hier tangieren. Laut dem Dokument kommt Battlemage mit x16 PCIe 5.0, was auf den größeren G10 Chip hindeutet. MLID nennt 512EU+448EU 16GB 387 mm² und 320EU/256EU 8-12GB 271 mm². Ansonsten die übliche Weltuntergangsstimmung zu Intel. Celestial und Druid dGPU gestrichen oder nur als low end. Die Wiederholung seiner Battlemage Story sozusagen. |
![]() |
![]() ![]() |
![]() |
#114 (im Thread / einzeln) |
Gold Member
|
Re: DG3 "Battlemage" (Xe2-HPG, Arc B-Series, 2024)
![]() MLID hat ein neues Video gepostet, diesmal mit angeblichen Dokumenten (von dem einiges geschwärzt ist). Zusammenfassung auf Videocardz.
Manchmal muss man von der Couch aufstehen um auf der Couch bleiben zu können
|
![]() |
![]() ![]() |
![]() |
#115 (im Thread / einzeln) |
Gold Member
Registriert: 2016-07-08
Beiträge: 861
|
Re: DG3 "Battlemage" (Xe2-HPG, Arc B-Series, 2024)
![]() Er vergisst immer AI natürlich wird Intel weiterhin massiv Geld in GPU versenken da es jeder Inverstor will. GPUs sind viel zu ineffektiv für AI und wie viel Prozent einer GPU sind AI beschleuniger? |
![]() |
![]() ![]() |
![]() |
#116 (im Thread / einzeln) |
Insane Member
Registriert: 2015-03-01
Beiträge: 18.276
|
Re: DG3 "Battlemage" (Xe2-HPG, Arc B-Series, 2024)
![]() AI wird aber Mittel bis langfristig auf AI Bescheuniger setzen. GPUs waren immer nur Türöffner für neue Märkte, sobald dieser groß genug waren, kamen angepasste Beschleuniger. |
![]() |
![]() ![]() |
![]() |
#117 (im Thread / einzeln) |
Master Member
Registriert: 2013-11-25
Beiträge: 8.751
|
Re: DG3 "Battlemage" (Xe2-HPG, Arc B-Series, 2024)
Kommt drauf an, was ihr mit ML meint. 0815 Client Inferencing wird langfristig in Accelerators aufgehen. Aber die <10% Die Size Vergrösserung durch Tensor Cores sind bei GPUs eher vernachlässigbar, wenn immer mehr ML Client & Workstation Anwendungsfelder entstehen. Und niemand packt sich bei Client einen 1000 TOPS ML Accelerator rein der nichts anderes kann und 1000$ kostet.
Ist auch ähnlich wie iGPU zu dGPU: Mit geringen Anforderungen geht alles mit einer APU. Wer mehr will packt eine Karte dazu. Geändert von basix (2024-01-27 um 17:53:38 Uhr) |
![]() ![]() |
![]() ![]() |
![]() |
#118 (im Thread / einzeln) |
Gold Member
Registriert: 2004-12-11
Beiträge: 820
|
Re: DG3 "Battlemage" (Xe2-HPG, Arc B-Series, 2024)
Schaut halt wirklich aus wie die guten alten Bitcoin-Mining-Rigs:
https://twitter.com/mov_axbx/status/1765573827080147416 https://twitter.com/mov_axbx/status/1765616681471152624 Und bei inferencing wird den A770 ein gutes Preis-Leistungsverhältnis nachgesagt. __tinygrad__ regt sich gerade ziemlich darüber auf, dass der Software-Stack von AMD nicht so besonders prickelnd ist: https://twitter.com/__tinygrad__/with_replies
O say, does that star-spangled banner yet wave
O'er the land of the free And the home of the brave? ![]() |
![]() |
![]() ![]() |
![]() |
#119 (im Thread / einzeln) |
Admiral Member
|
Re: DG3 "Battlemage" (Xe2-HPG, Arc B-Series, 2024)
Wut?
1/2 4090 wäre mega gut für einen Lastgen Midrange Chip wie die A770. Die VRAM größe ist auch sehr sehr wichtig und ist mit 16GB für den preis sehr gut. ![]() Schaut halt wirklich aus wie die guten alten Bitcoin-Mining-Rigs: |
![]() |
![]() ![]() |
![]() |
#120 (im Thread / einzeln) |
Gold Member
Registriert: 2004-12-11
Beiträge: 820
|
Re: DG3 "Battlemage" (Xe2-HPG, Arc B-Series, 2024)
Es kann sein, dass dies erste Sisoft-Werte von Battlemage sind
https://twitter.com/miktdt/status/1771576768542998893
O say, does that star-spangled banner yet wave
O'er the land of the free And the home of the brave? ![]() |
![]() |
![]() ![]() |
![]() |
Lesezeichen |
Stichworte |
arc, b-series, battlemage, dg3, intel, xe2 ![]() |
Ansicht |
![]() |
![]() |
![]() |
|
|