PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : 2006: 10 neue Itanium-CPUs - meist DC


kelo
2005-10-14, 01:52:22
http://www.heise.de/newsticker/meldung/64888
Die ungeraden Modellnummern weisen auf den schnelleren FSB667-Frontsidebus hin; dafür ausgelegte Modelle mit Madison-Kern sind schon jetzt erhältlich. Intel hat allerdings keinen eigenen FSB667-Chipsatz, sondern nur den FSB400-tauglichen E8870 -- die FSB533- und FSB667-Itaniums benötigen also Chipsätze von anderen Serverherstellern wie vor allem HP, aber auch NEC oder Hitachi. Alle anderen Montecitos sind für FSB400 und FSB533 ausgelegt, der Low-Voltage-Typ mit 62 Watt Leistungsaufnahme, 1,2 GHz Taktfrequenz und 12 MByte L3-Cache nur für FSB400.
Intel will die anderen Modelle in den Taktfrequenz-Stufen 1,4 GHz (9020, 9021), 1,6 GHz (9010, 9011, 9040, 9041), 1,7 GHz (9030, 9031) und 1,8 GHz (9055) anbieten, dazu kommen unterschiedliche L3-Cache-Größen: 24 MByte (beim 9055 mit 1,7 Milliarden Transistoren), 18 MByte (9040/41), 12 MByte (9020/21), 8 MByte (9030/31) sowie 6 MByte (9010/11). Alle Montecitos unterstützen die Virtualisierungstechnik Vanderpool (VT), Foxton (100 oder 200 MHz Steigerung) und Pellston. Der 9010/9011 hat nur einen Kern und unterstützt Hyper-Threading (HT) nicht, der 9030/9031 hat zwei Kerne, aber ebenfalls kein HT. Alle anderen bieten Dual-Core und HT.
Intel lässt nicht locker. Wenn die so weiter machen, wird Itanium ein Hit oder geht ruhmreich mit wehenden Fahnen unter.

Coda
2005-10-14, 03:07:31
Sollen sie doch. Ein Opteron-Cluster mit Infiniband direkt am Hypertransport ist trotzdem um einige effektiver und kostengünstiger ;)

Muh-sagt-die-Kuh
2005-10-14, 10:35:50
Sollen sie doch. Ein Opteron-Cluster mit Infiniband direkt am Hypertransport ist trotzdem um einiges effektiver und kostengünstiger ;)Ohne die passenden Vergleichswerte ist dies nicht mehr als eine Behauptung ;)

Stone2001
2005-10-14, 11:10:31
Sollen sie doch. Ein Opteron-Cluster mit Infiniband direkt am Hypertransport ist trotzdem um einige effektiver und kostengünstiger ;)
Kostengünstiger: Ja!
Effektiver: Das sehen unsere Leute vom RZ anders. In Realworld-Anwendungen ist der Itanium besser. (das haben die Untersuchungen zur Anschaffung des neuen Clusters ergeben, aber mehr als ein Teraflop aus 11 Teraflop Rohleistung bekommen auch sie nicht raus ;) )

BlackBirdSR
2005-10-14, 14:11:15
Kostengünstiger: Ja!
Effektiver: Das sehen unsere Leute vom RZ anders. In Realworld-Anwendungen ist der Itanium besser. (das haben die Untersuchungen zur Anschaffung des neuen Clusters ergeben, aber mehr als ein Teraflop aus 11 Teraflop Rohleistung bekommen auch sie nicht raus ;) )

Kunststück..
EPIC wurde ja auch explizit ;) dafür entwickelt, schneller zu sein als der großteil der Konkurrenz.
In Sachen Leistung stehen auch nur die PowerPC im Weg.

Die NASA setzt z.B nicht umsonst auf ein gigantisches System aus Itanium2 Prozessoren namens "Columbia" (51.9 TeraFlop/s).

Allerdings muss man hier Unterschieden. Effektiver kann sich auf Vieles beziehen, und gerade wenn der Preis eine Rolle spielt, oder auch der Platz und die Kühlung, dann muss ein Itanium2 Cluster nicht effektiver sein. Auch bei der Anbindung hat der K8 Vorteile, was ihm hier mehr Effektivität zuspricht. Wie Coda schon angab: Infiniband am Hypertransport gegenüber den Infiniband und Gigabit Ethernet Verbindungen bei Columbia.
In Sachen Leistung pro Takt besteht natürlich kein Zweifel.

kelo
2005-10-14, 20:39:11
Kostengünstiger: Ja!
Effektiver: Das sehen unsere Leute vom RZ anders. In Realworld-Anwendungen ist der Itanium besser. (das haben die Untersuchungen zur Anschaffung des neuen Clusters ergeben, aber mehr als ein Teraflop aus 11 Teraflop Rohleistung bekommen auch sie nicht raus ;) )
Welchen Compiler setzt ihr ein?
Die Compiler können immer noch nicht richtig auf den Itanium optimieren.

GloomY
2005-10-14, 22:33:07
Sollen sie doch. Ein Opteron-Cluster mit Infiniband direkt am Hypertransport ist trotzdem um einige effektiver und kostengünstiger ;)So pauschal würde ich das nicht sagen. Bei Integer-Code ja, insbesondere im Server-Bereich. Bei Fliesskommarechnungen hat der Opteron aber nicht die brachiale Rechenkraft des Itaniums. Letzterer kann zwei FP-MAC pro Takt ausspucken, die z.B. bei Linpack auch annähernd erreicht (http://www.realworldtech.com/page.cfm?ArticleID=RWT100404214638&p=3) werden, so lange die Daten im L2 liegen.
Welchen Compiler setzt ihr ein?
Die Compiler können immer noch nicht richtig auf den Itanium optimieren.Ach nee? Was macht denn dann der Intel Compiler für den Itanium? Oder der von HP? :conf2:

Coda
2005-10-14, 22:43:08
So pauschal würde ich das nicht sagen. Bei Integer-Code ja, insbesondere im Server-Bereich. Bei Fliesskommarechnungen hat der Opteron aber nicht die brachiale Rechenkraft des Itaniums. Letzterer kann zwei FP-MAC pro Takt ausspucken, die z.B. bei Linpack auch annähernd erreicht (http://www.realworldtech.com/page.cfm?ArticleID=RWT100404214638&p=3) werden, so lange die Daten im L2 liegen.Ja schon, aber für den Preis lassen sich ja auch bestimmt 3-4 Opterons kaufen, oder nicht?

Ach nee? Was macht denn dann der Intel Compiler für den Itanium? Oder der von HP? GCC ist Meister im Scheißcode-für-Itanium-generieren :D

kelo
2005-10-14, 23:32:41
So pauschal würde ich das nicht sagen. Bei Integer-Code ja, insbesondere im Server-Bereich. Bei Fliesskommarechnungen hat der Opteron aber nicht die brachiale Rechenkraft des Itaniums. Letzterer kann zwei FP-MAC pro Takt ausspucken, die z.B. bei Linpack auch annähernd erreicht (http://www.realworldtech.com/page.cfm?ArticleID=RWT100404214638&p=3) werden, so lange die Daten im L2 liegen.
Ach nee? Was macht denn dann der Intel Compiler für den Itanium? Oder der von HP? :conf2:
GCC ist Meister im Scheißcode-für-Itanium-generieren :D
So optimal nicht. Wenn von 11 Teraflops nur 1 Terraflop genutzt werden, dann haben die entweder GCC eingesetzt, oder der Intel/HP-Compiler arbeitet noch nicht richtig optimal.

@Coda
Hätte es nicht besser ausgedrückt :up:
Aber sind die beim Optimieren noch nicht weiter? :conf2:

Stone2001
2005-10-14, 23:58:31
Welchen Compiler setzt ihr ein?
Die Compiler können immer noch nicht richtig auf den Itanium optimieren.
Keine Ahnung, bin kein Mitarbeiter des Rechenzentrums und der Leiter des Rechenzentrums hat hierzu kein Wort gesagt.
Es gibt aber wohl nur 3 Möglichkeiten, entweder ein Compiler von Intel, ein Compiler von HP oder ein Compiler Marke Eigenbau. Wobei ich jetzt mal auf einen Compiler von HP tippen würde.

(del)
2005-10-15, 16:53:13
Ich frag mich grade wie gut wirklich EPIC ist und wie gut ein Opteron rechnen würde, wenn er 9MB L3 Cache hätte :| Wieder mal am schnellsten wird auch der neue Intanium sein. Keine Frage. 24MB Cache :eek: :biggrin:

Coda
2005-10-15, 16:58:03
EPIC braucht aber auch verdammt viel Code-Cache. Aber mit 24MiB dürfte das - äh - erschlagen sein.

Muh-sagt-die-Kuh
2005-10-15, 17:13:28
EPIC braucht aber auch verdammt viel Code-Cache. Aber mit 24MiB dürfte das - äh - erschlagen sein.Das ist die L3 Ebene mit 2 x 12 MiB Unified-Cache. Montecito hat auch eine völlig umgekrempelte, non-Unified L2 Stufe: 1 MiB Instruction Cache und 256 KiB Data Cache ;)

Coda
2005-10-15, 17:27:50
Ich weiß ;)

Aber ich verstehe nicht, warum Intel dem Itanium keinen On-Die-Memory-Controler verpasst.

Muh-sagt-die-Kuh
2005-10-15, 19:13:04
Ich weiß ;)

Aber ich verstehe nicht, warum Intel dem Itanium keinen On-Die-Memory-Controler verpasst.Tukwila bekommt im Zuge einer kompletten Umstellung auf On-Die-Controller und ein serielles Chipsatz-Interface in allen Baureihen einen solchen, wahrscheinlich für FB-DIMMs. War da nicht mal was, dass Itanium und Xeon dann in den gleichen Sockel passen werden?

(del)
2005-10-15, 20:59:38
EPIC braucht aber auch verdammt viel Code-Cache. Aber mit 24MiB dürfte das - äh - erschlagen sein.
Jou. Jemand witzelte auf dem Job letztens, daß ein "Hello World" in C auf Itanium 320KB lang ist :rolleyes: Mich wundert auch nicht, daß die CPU so schnell ist. Wenn man ihr alles so mundgerecht kompiliert (kompilieren muß), daß es fast schon wie reiner disgepatchter Microcode aussieht :uponder: An sich eine Architektur für die man erstmal 10 Jahre lang lernt effiziente Kompiler zu bauen. hmm...

Coda
2005-10-15, 22:07:42
Ich verstehe da aber eh nicht was das Problem für Intel ist. Wenn sie die superskalare und out-of-order Logik im Chip implementieren können (x86) warum dann nicht im Compiler?

LOCHFRASS
2005-10-15, 23:07:15
War da nicht mal was, dass Itanium und Xeon dann in den gleichen Sockel passen werden?

So hiess es vor Jahren, als IA64 noch als IA32-Ersatz gehandelt war. Seitdem habe ich von Sockelkompatibilitaet zwischen Xeon und Itanium nichts mehr gehoert.

GloomY
2005-10-16, 12:15:19
Die Diskussion über Cluster habe ich mal nach hier (http://www.forum-3dcenter.org/vbulletin/showthread.php?t=254304) rausgesplittet. :)

HellHorse
2005-10-16, 16:29:29
An sich eine Architektur für die man erstmal 10 Jahre lang lernt effiziente Kompiler zu bauen. hmm...
Und wie lange ging's bis wir anständige C++ Compiler auf x86 hatten?

(del)
2005-10-16, 18:41:48
Und wie lange ging's bis wir anständige C++ Compiler auf x86 hatten?
Hast auch wieder Recht. Es ist höchste Zeit für was neues... :rolleyes: