Intel Core 2 Extreme QX9650: Der 45 nm Yorkfield im Praxistest - 5/19
29.10.2007 by doelf
Der komplette Artikel als Druckversion
Intelligent Power Capability
Die Core-Mikroarchitektur hat ihre Wurzeln im Mobilprozessor Pentium M und dies wird insbesondere in Hinblick auf die Stromsparfunktionen deutlich. Die Prozessoren verfügen über Intels SpeedStep Technologie, welche die Kerne abhängig vom Lastzustand taktet oder gar in verschiedene Ruhezustände versetzt. Mit der Taktrate wird natürlich auch die CPU-Spannung abgesenkt. Doch damit nicht genug: Diese Prozessoren sind zudem in der Lage, nicht benötigte Logik-Baugruppen abzuschalten, um dadurch weitere Energie zu sparen. Hierzu gehören beispielsweise Teile des Caches. Auch die Busse und Arrays wurden unterteilt ("split"), um diese teilweise deaktivieren zu können, wenn sie nicht vollständig benötigt werden. Ein Problem bei solchen Stromsparfunktionen sind die Einschlaf- und Aufwachphasen, die sich nicht negativ auf die Reaktionsgeschwindigkeit der CPU auswirken dürfen. Intel bewerkstelligt das Ein- und Ausschalten innerhalb eines Taktzyklus, weshalb es kaum zu Auswirkungen auf die CPU-Leistung kommen sollte.
Neu: Deep Power Down Technology
Zu den bekannten C-States gesellt sich beim Penryn ein neuer Zustand namens "Deep Power Down". Wird Deep Power Down aktiviert, schalten der Taktgeber des Prozessors und der PLL wie beim C3 und C4 ab, zusätzlich wird jedoch auch der komplette Cache - sowohl Level 1 als auch Level 2 - nicht nur geleert, sondern vollständig deaktiviert. Dies emöglicht es der CPU, die Spannung noch weiter abzusenken. Allerdings wacht der Prozessor aus diesem Zustand auch etwas langsamer wieder auf, es sollen laut Intel maximal 150 Mikrosekunden vergehen.
Obwohl Intel für seine Mobil- und Desktopprozessoren die selben Wafer verwendet, werden nur Mobil-CPUs über die Deep Power Down Technologie verfügen. Die Kontrolle über die Aktivierung von Deep Power Down hat zwar das Betriebssystem, doch der Chipsatz ist letztendlich dafür verantwortlich, dass sich die CPU in diesen Zustand begibt. Intels Desktop-Chipsätze beherrschen dies nicht und in absehbarer Zeit wird Intel daran auch nichts ändern. Jeder der Prozessorkerne besitzt 8 KByte SRAM (VccP), in denen er seinen Status beim Eintreten eines MWAIT-Ereignisses abspeichert. Sobald ein I/O-Ereignis dem Chipsatz signalisiert den Kern wieder aufzuwecken, führt dieser einen internen Reset durch und liest seinen vorherigen Status wieder aus.
Der Wechsel in den Deep Power Down Status und wieder zurück ist vergleichsweise energieintensiv. Daher muss sichergestellt werden, dass solche Wechsel nicht zu häufig stattfinden, da die Energiebilanz ansonsten ins Negative abrutscht. Nur wenn der Kern für 3 bis 4 ms im Deep Power Down verbleibt, lässt sich tatsächlich Strom sparen. Daher hat Intel eine Logik integriert, welche die Länge der vorherigen Deep Power Down Phasen prüft und - falls diese zu kurz waren - stattdessen einen niedrigeren Ruhezustand wie beispielsweise C4 ausführt.
Durch Deep Power Down lassen sich laut Intel im normalen Büroalltag zwischen 27 und 44 Prozent Strom sparen. Es sollte somit möglich sein, die Akkulaufzeit von mobilen Computern mit Hilfe von Deep Power Down signifikant zu verlängern. Hierzu müssen die Hersteller der Notebook den neuen C-State allerdings in ihr BIOS integrieren.
Neu: Enhanced Dynamic Acceleration Technology (EDAT)
Nicht auf eine längere Akkulaufzeit, sondern auf mehr Leistung zielt die "Enhanced Dynamic Acceleration Technology". Auch diese Neuerung wird Intel vorerst nur für Mobilprozessoren anbieten. Es geht hierbei darum, die beste Rechenleistung aus den vorhandenen Temperatur- und Verbrauchsgrenzen herauszukitzeln. Wenn beispielsweise nur ein Kern aktiv ist und sich der zweite in einem Ruhezustand befindet, hat der Prozessor noch reichlich Spielraum bis zu seiner maximal erlaubten Temperatur- und Verbrauchsschwelle. Diesen Spielraum nutzt EDAT dazu, den aktiven Kern mit einer höheren Spannung und Taktrate zu betreiben, so dass Anwendungen, welche nur einen Kern verwenden, mehr Rechenleistung zur Verfügung steht.
Natürlich macht es keinen Sinn, die Taktrate sofort zurückzuschrauben, wenn der zweite Kern aktiv wird. Schließlich besteht die Möglichkeit, dass dieser nur für einen kurzen Zeitraum genutzt wird. Intel hat hierzu einen Hysteresis Mechanismus integriert, welcher eine Überlappung ermöglicht, in der beide Kerne und EDAT zeitgleich aktiv sind. Die Spannungswandler der Hauptplatine müssen für diese kurzfristige Spitzenbelastung ausgelegt sein.
In der Praxis soll EDAT - abhängig von den verwendeten Anwendungen und der Auslastung des Prozessors - zwischen 5 und 7 Prozent Mehrleistung ermöglichen.
Neu: CC3 State
Die dritte Neuerung betrifft abermals nicht unsere Dektop-CPU, diesmal geht es um die Workstation- und Server-Plattform. Da auf solchen Plattformen zumeist Last anliegt, sind die Stromspartechniken nicht so sehr ausgeprägt. Die Kerne Intels aktueller 65 nm Xeon Prozessoren gehen lediglich in den C1-Zustand, wenn keine Last anliegt. Im C1 bleiben jedoch die Inhalte der Level 1 und 2 Caches erhalten und es finden ständig Snoops statt. Das bedeutet, dass auch die im Ruhezustand befindlichen Kerne die Adressierungen der aktiven Kerne auf dem Bus mitlesen und diese Adressen mit dem Inhalt ihres eigenen Caches abgleichen, um Cache-Inkohärenzen durch die Speicherzugriffe der aktiven Kerne zu vermeiden. Solche Snoops zeichnen sich für ca. 30 Prozent des Stromverbrauchs eines Prozessorkernes verantwortlich.
Die Lösung ist recht einfach: Der Kern wird in den C3 State versetzt, bei dem der Inhalt des Level 1 Caches in den Level 2 Cache kopiert wird, der Level 1 Cache wird danach komplett geleert. Im C3 finden keine Snoops statt und der Stromverbrauch kann um bis zu 16 Prozent gesenkt werden, ohne dass es zu nennenswerten Leistungseinbrüchen kommt.
1. 15 Monate Core-Mikroarchitektur
2. 45 nm: High-k und Metal Gates
3. Wide Dynamic Execution und Radix-16 Divider
4. Advanced Digital Media Boost, SSE4 und Super Shuffle Engine
5. Intelligent Power Capability, DPD, EDAT und CC3 State
6. Smart Memory Access, Advanced Smart Cache, VT und FSB1600
7. Intel Core 2 Extreme QX9650 und Testsystem
8. CPU-Leistung (synthetisch)
9. Multithreaded (synthetisch)
10. Datendurchsatz von Speicher und Cache
11. Primzahlen und Pi
12. Raytracing und Rendering
13. Kompression und mp3-Encoding
14. Video-Encoding
15. 3DMark06 und F.E.A.R.
16. Riddick und UT2004
17. Stromverbrauch
18. Übertakten
19. Fazit
Diesen Testbericht diskutieren...