Der Larrabee wird Intels erster "Many-Core-Prozessor" sein, in aktuellen Folien ist von 8 bis 48 Kernen die Rede. Jeder einzelne Kern stellt einen vollwertigen x86-Prozessor dar und kann auch als ein solcher programmiert werden. Um die Komplexität gering zu halten, dient nicht Intels aktuelle Core-Mikroarchitektur als Grundlage für den Larrabee, sondern der bereits 1993 eingeführte Pentium-Kern.
Der Pentium ist eine 2-fach superskalare Architektur (Pentium 4: 3-fach; Core 2: 4-fach) mit einer für heutige Verhältnisse extrem kurzen Pipeline und einer vollständig kohärenten (zusammenhängenden) Cache-Struktur. Beim Facelift hinzu gekommen sind Multi-Threading, Intels 64-Bit-Erweiterung, eine Vector Processing Unit (VPU) sowie ein Prefetcher. Dank des Multi-Threading kann jeder Kern nun vier Threads mit eigenen Register-Sets zeitgleich bearbeiten. Um eine möglichst hohe Effizienz zu erreichen und Latenzen zu minimieren, verwendet Intel eine simple In-order Pipeline. Die VPU ist 512 Bit breit, sie kann sechzehn 32-Bit Operationen pro Taktzyklus durchführen.
Jedem Kern steht ein dedizierter L1-Cache für Daten und Befehle zur Verfügung, den L2-Cache teilen sich alle Kerne. Der L2-Cache ist partitioniert, so dass jeder Kern einen eigenen, 256 KByte großen Bereich zugeteilt bekommt. Dennoch kann jeder Kern auf den vollständigen L2-Cache zugreifen. Ein 1024-Bit breiter Ringbus (512 Bits pro Richtung) ermöglicht eine extrem schnelle Kommunikation zwischen den einzelnen Kernen und senkt Latenzen auf ein Minimum.
Neben DirectX und OpenGL kann der Larrabee auch über eine C/C++ API programmiert werden. Obwohl der Many-Core-Prozessor auch mit aktuellen Spielen zurecht kommt, ist sein Einsatzgebiet ungleich weiter gefasst. Da es sich um ganz normale x86-Kerne handelt, kann der Larrabee als universeller Co-Prozessor genutzt werden. Entsprechend optimierte Programme könnten die Physikberechnung in Spielen, das Umrechnen von Videodaten oder das Komprimieren von Dateien, aber auch wissenschaftliche Simulationen oder 3D-Renderings erheblich beschleunigen. Der Larrabee beherrscht Fließkommaberechnungen mit einfacher und doppelter Präzision gemäß IEEE und erfüllt somit auch die notwendigen Vorraussetzungen für Anwendungen aus dem Finanzbereich.
Wie Intel in einem Diagramm zeigt, skaliert der Larrabee bei den Spielen F.E.A.R, Half Life 2 Episode 2 und Gears of War beinahe linear und scheint kaum Probleme mit dem Overhead zu haben, der normalerweise bei der Verteilung einer Aufgabe auf zahlreiche Threads entsteht. Selbst bei der Verwendung von 48 Kernen weicht die Kurve um lediglich sieben bis zehn Prozent vom linearen Verlauf ab - eine erstaunlich gute Effizienz.
Fazit
Erste Grafikkarten auf Basis des Larrabee sollen 2009 oder 2010 auf den Markt kommen, in welcher Leistungsklasse diese anzusiedeln sind, lässt sich derzeit aber noch nicht abschätzen. Es ist davon auszugehen, dass Intel den Larrabee auch als Co-Prozessor für wissenschaftliche Simulationen anbieten wird, dies wollten unsere Gesprächspartner jedoch noch nicht bestätigen. Zweifelsohne ist der Larrabee eine General-Purpose-GPU (GPGPU) mit einer Flexibilität, wie sie aktuell kein Mitbewerber bieten kann. Intel hat die Bedrohung durch extrem leistungsfähige Co-Prozessoren wie AMDs Stream Prozessoren und NVIDIAs Tesla erkannt und mit seinen eigenen Mitteln reagiert. Man darf sehr gespannt sein, wie der Markt auf Larrabee reagieren wird.