www.Au-Ja.de - http://www.au-ja.de/preview-intel-larrabee-print.phtml

Preview: Intel Larrabee - Druckansicht - Seite 1 von 2

Die Rechenleistung ist in den letzten Jahren deutlich gestiegen und die Chipdesigns wurden immer komplexer. Dies gilt zum einen für Mikroprozessoren, zum anderen aber noch viel mehr für Grafikprozessoren. Insbesondere bei der Betrachtung der Transistorenzahl offenbart sich diese Komplexität:

Bereits im Jahr 2002 hatte NVIDIAs GeForce FX 5800 mit 125 Millionen doppelt so viele Transistoren wie Intels Pentium 4 auf Basis des Northwood-Kerns. Aufgrund seines größeren Caches kam Intels nächste Generation "Prescott" im Jahr 2004 ebenfalls auf 125 Millionen Transistoren, doch NVIDIA hatte da schon seinen GeForce 6800 Ultra mit 222 Millionen Transistoren auf dem Markt. 2006 schickt Intel seine Dual-Core Prozessoren mit Conroe-Kern an den Start, doch während diese auf stolze 291 Millionen Transistoren kommen, ist NVIDIAs GeForce 8800 GTX mit 681 Millionen Transistoren weiter entfernt denn je. Heute bringt Intels schnellster Quad-Core Prozessor, der Core 2 Extreme QX9770, 820 Millionen Transistoren auf die Waage, NVIDIAs Schwergewicht GeForce GTX 280 ist mit 1.400 Millionen aber auch weiterhin viel komplexer. Die Fertigung solch aufwändiger Chips ist jedoch teuer, die Ausfallraten sind hoch und auch der Stromverbrauch der Grafikkarten ist in den letzten Jahren deutlich angestiegen.

Liegen der mit 2,8 GHz getaktete Pentium 4 Northwood und die GeForce FX 5800 noch Kopf an Kopf, klafft spätestens seit Einführung der Direct X 10 GPUs eine große Lücke zwischen Grafik- und Mikroprozessoren. Während eine CPU ein bis vier Kerne besitzt, ist die Parallelisierung bei Grafikprozessoren bereits viel weiter vorangeschritten. Die GeForce 8800 GTX besitzt bereits 128 Stream-Prozessoren und bei NVIDIAs aktuellem Top-Modell GeForce GTX 280 kommen sogar 240 Stream-Prozessoren zum Einsatz. Natürlich sind diese Unified Shader vergleichsweise simpel aufgebaut und auf bestimmte Rechnungen spezialisiert, dennoch macht es Sinn, diese Rechenkraft auch abseits der reinen Grafikausgabe zu nutzen. AMDs Stream Prozessoren und NVIDIAs Tesla sind Beispiele für die Verwendung von Grafikchips als Co-Prozessor für wissenschaftliche Anwendungen - und hier geht es um den Teraflop-Bereich!

Die Mikroprozessoren sind in den letzten Jahren deutlich effizienter geworden, während zugleich die Zahl ihrer Kerne stieg. Bei den Grafikprozessoren, welche schon viel länger mit parallelen Strukturen arbeiten, sehen wir hingegen eine Entwicklung von der Spezialisierung hin zu einer immer größeren Flexibilität. Der Grafikprozessor droht zur Konkurrenz des Mikroprozessors zu werden und Intel hat hierfür eine originelle Lösung gefunden: Der Chipriese will eine GPU aus x86-Mikroprozessorkernen auf den Markt bringen, den Larrabee.




Preview: Intel Larrabee - Druckansicht - Seite 2 von 2

Der Larrabee wird Intels erster "Many-Core-Prozessor" sein, in aktuellen Folien ist von 8 bis 48 Kernen die Rede. Jeder einzelne Kern stellt einen vollwertigen x86-Prozessor dar und kann auch als ein solcher programmiert werden. Um die Komplexität gering zu halten, dient nicht Intels aktuelle Core-Mikroarchitektur als Grundlage für den Larrabee, sondern der bereits 1993 eingeführte Pentium-Kern.

Der Pentium ist eine 2-fach superskalare Architektur (Pentium 4: 3-fach; Core 2: 4-fach) mit einer für heutige Verhältnisse extrem kurzen Pipeline und einer vollständig kohärenten (zusammenhängenden) Cache-Struktur. Beim Facelift hinzu gekommen sind Multi-Threading, Intels 64-Bit-Erweiterung, eine Vector Processing Unit (VPU) sowie ein Prefetcher. Dank des Multi-Threading kann jeder Kern nun vier Threads mit eigenen Register-Sets zeitgleich bearbeiten. Um eine möglichst hohe Effizienz zu erreichen und Latenzen zu minimieren, verwendet Intel eine simple In-order Pipeline. Die VPU ist 512 Bit breit, sie kann sechzehn 32-Bit Operationen pro Taktzyklus durchführen.

Jedem Kern steht ein dedizierter L1-Cache für Daten und Befehle zur Verfügung, den L2-Cache teilen sich alle Kerne. Der L2-Cache ist partitioniert, so dass jeder Kern einen eigenen, 256 KByte großen Bereich zugeteilt bekommt. Dennoch kann jeder Kern auf den vollständigen L2-Cache zugreifen. Ein 1024-Bit breiter Ringbus (512 Bits pro Richtung) ermöglicht eine extrem schnelle Kommunikation zwischen den einzelnen Kernen und senkt Latenzen auf ein Minimum.

Neben DirectX und OpenGL kann der Larrabee auch über eine C/C++ API programmiert werden. Obwohl der Many-Core-Prozessor auch mit aktuellen Spielen zurecht kommt, ist sein Einsatzgebiet ungleich weiter gefasst. Da es sich um ganz normale x86-Kerne handelt, kann der Larrabee als universeller Co-Prozessor genutzt werden. Entsprechend optimierte Programme könnten die Physikberechnung in Spielen, das Umrechnen von Videodaten oder das Komprimieren von Dateien, aber auch wissenschaftliche Simulationen oder 3D-Renderings erheblich beschleunigen. Der Larrabee beherrscht Fließkommaberechnungen mit einfacher und doppelter Präzision gemäß IEEE und erfüllt somit auch die notwendigen Vorraussetzungen für Anwendungen aus dem Finanzbereich.

Wie Intel in einem Diagramm zeigt, skaliert der Larrabee bei den Spielen F.E.A.R, Half Life 2 Episode 2 und Gears of War beinahe linear und scheint kaum Probleme mit dem Overhead zu haben, der normalerweise bei der Verteilung einer Aufgabe auf zahlreiche Threads entsteht. Selbst bei der Verwendung von 48 Kernen weicht die Kurve um lediglich sieben bis zehn Prozent vom linearen Verlauf ab - eine erstaunlich gute Effizienz.

Fazit
Erste Grafikkarten auf Basis des Larrabee sollen 2009 oder 2010 auf den Markt kommen, in welcher Leistungsklasse diese anzusiedeln sind, lässt sich derzeit aber noch nicht abschätzen. Es ist davon auszugehen, dass Intel den Larrabee auch als Co-Prozessor für wissenschaftliche Simulationen anbieten wird, dies wollten unsere Gesprächspartner jedoch noch nicht bestätigen. Zweifelsohne ist der Larrabee eine General-Purpose-GPU (GPGPU) mit einer Flexibilität, wie sie aktuell kein Mitbewerber bieten kann. Intel hat die Bedrohung durch extrem leistungsfähige Co-Prozessoren wie AMDs Stream Prozessoren und NVIDIAs Tesla erkannt und mit seinen eigenen Mitteln reagiert. Man darf sehr gespannt sein, wie der Markt auf Larrabee reagieren wird.




© copyright 1998-2021 by Dipl.-Ing. Michael Doering
www.Au-Ja.de / www.Au-Ja.org / www.Au-Ja.com / www.Au-Ja.net ist eine Veröffentlichung von Dipl.-Ing. Michael Doering.
Alle Marken oder Produktnamen sind Eigentum der jeweiligen Inhaber. Alle Inhalte spiegeln die subjektive Meinung der jeweiligen Autoren wieder und sind geistiges Eigentum dieser Autoren. Alle Angaben sind ohne Gewähr! Wir setzen bei Nutzung unserer Publikation ausdrücklich die Verwendung des gesunden Menschenverstandes voraus. Sollten Sie mit dieser Voraussetzung nicht einverstanden sein, verstoßen sie gegen unsere Nutzungsbedingungen! Die Verwendung jeglicher Inhalte - auch auszugsweise - ist nur mit ausdrücklicher, schriftlicher Genehmigung erlaubt. Die Nutzung kurzer Ausschnitte für Nachrichten-Ticker ist hiervon ausdrücklich ausgenommen! Die geheimdienstliche Erfassung und Verarbeitung dieser Internetseite ist strengstens untersagt!
Sollten Ihnen über Hyperlink verknüpfte externe Inhalte auffallen, welche mit der deutschen oder europäischen Rechtssprechung in Widerspruch stehen, bitten wir um eine kurze Meldung. Kommentare und Hinweise zu rechtswidrigen Inhalten unseres lokalen Angebotes sind natürlich ebenfalls erwünscht. Weitere Informationen finden Sie im Impressum!

www.Au-Ja.de - http://www.au-ja.de/preview-intel-larrabee-print.phtml