www.Au-Ja.de - http://www.au-ja.de/review-intel-corei7-extreme-965-print.phtml

Intel Core i7 Extreme 965, 940 und 920 im Test (Bloomfield) - Druckansicht - Seite 1 von 39

Tock. Wir dürfen bereits heute die neuen Core i7 Prozessoren, welche Intel selbst erst in zwei Wochen vorstellen wird, in einem umfassenden Testbericht präsentieren. Der Core i7 repräsentiert ein "Tock" in Intels Tick-Tock-Entwicklungszyklus und somit eine neue Architektur. Intels letzter Architekturwechsel liegt zwei Jahre zurück und leitete die Erfolgsgeschichte der Core 2 Prozessoren ein. Wird mit dem Core i7 als ersten Vertreter der Nehalem-Architektur ein ähnlich drastischer Leistungssprung gelingen?


Fotostrecke mit weiteren und größeren Fotos...

Nehalem: Ziele, Modelle und Preise
Angesichts der Dominanz von Intels aktueller Penryn-Generation fällt es schwer, sich einen weiteren Architektursprung vorzustellen. Auf einem Pressetermin in München hatten wir Gelegenheit, Intel nach der Zielsetzung für den Nehalem zu fragen. Doch zunächst müssen wir ein paar Begriffe klären: Der Oberbegriff für die neue Architektur lautet "Nehalem", diese wird aber weiterhin unter der Marke "Intel Core" angeboten werden. Als erste CPU-Familie der Nehalem-Architektur kommt Mitte November der Core i7 (Codename: Bloomfield) auf den Markt.

Zunächst werden drei Prozessoren zur Auswahl stehen:

Alle drei Modelle werden bereits von deutschen Händlern gelistet und kosten dort 1024, 577 bzw. 302 Euro. Die US-Preise beinhalten zwar noch keine Mehrwertsteuer, dennoch erscheinen uns diese fühen Angebote überteuert. Bis Ende November sollten diese Preise bereits deutlich gesunken sein.

Ein Nehalem-Wafer:

Fotostrecke mit weiteren und größeren Fotos...

Mit dem Nehalem will Intel seinen Leistungsvorsprung weiter ausbauen und insbesondere die Anbindung des Prozessors an die übrigen Systemkomponenten verbessern. Nicht nur neue, speziell auf den Nehalem optimierte Anwendungen, sondern insbesondere auch alte Software soll von diesen Maßnahmen profitieren. Der Stromverbrauch soll dabei im Vergleich zum Penryn nicht ansteigen und laut Intel wurden nur jene Features integriert, die zugleich die Leistung und die Energieeffizienz verbessern konnten. Im Mobil-Segment wird es Nehalem basierende Prozessoren mit zwei und vier Kernen geben, für den Desktop-Markt wurden bisher nur die oben genannten Quad-Core CPUs angekündigt und für Server kommen auch Prozessoren mit bis zu acht Kernen. Betrachten wir nun die Neuerungen im Detail.

Ein neuer Sockel: LGA1366
Da Intel mit dem Core i7 einen Architekturwechsel vollzieht, bleibt man zugleich der im letzten Jahr mit dem Penryn eingeführten 45 nm Fertigungstechnologie treu. Das augenscheinlichste Merkmal dafür, dass wir es mit einer neuen Architektur zu tun haben, ist der CPU-Sockel. Der Sockel LGA775, welchen Intel seinerzeit als Plattform für die Chipsätze 915 und 925 zusammen mit dem 90 nm Pentium 4 Prescott präsentiert hatte, wird im Laufe der kommenden Monate nach und nach ausgemustert. Auf unserer heutigen Testplattform finden wir stattdessen den neuen Sockel LGA1366.


Fotostrecke mit weiteren und größeren Fotos...

Für diesen Sockel werden neue CPU-Kühler bzw. zumindest neue Befestigungsmechanismen benötig. Zwar setzt Intel auch weiterhin auf vier Bohrungen im quadratischen Raster, doch beim Sockel LGA1366 liegen die Löcher etwas weiter auseinander (80 statt 72 mm).


Fotostrecke mit weiteren und größeren Fotos...

Core und Uncore
Beim Nehalem unterscheidet Intel zwischen den eigentlichen CPU-Kernen (Core) und den weiteren Bestandteilen des Prozessors (Uncore), welche die Kommunikation der Kerne untereinander und mit dem System ermöglichen. Hierzu gehört der integrierte Speicher-Controller, der L3-Cache und die QPI-Anbindung zum Chipsatz. Weiterhin zählt Intel den Energie-Controller (PCU) zum Uncore.


Fotostrecke mit weiteren und größeren Fotos...

Beim Nehalem stecken somit einige der wichtigsten Neuerungen nicht in den Kernen selbst, sondern vielmehr im Uncore. Man kann es vielleicht folgendermaßen formulieren: Bisher mussten die Kerne mit dem Chipsatz verhandeln, was beispielsweise bei Speicherzugriffen zu Verzögerungen führte. Beim Nehalem haben die Kerne nun einen eigenen Manager bekommen, der ihnen diese Arbeit abnimmt und sich darum kümmert, dass sie ihre optimale Leistung entfalten können. Und da wir uns sowieso gerade mit dem CPU-Sockel auseinandersetzen, kümmern wir uns zunächst um den Uncore.

Bevor wir es vergessen: Wer mehr über die Core-Mikroarchitektur, auf welcher der Nehalem aufbaut, erfahren möchte, sollte unseren Artikel zum Core 2 Extreme QX9650 lesen!




Intel Core i7 Extreme 965, 940 und 920 im Test (Bloomfield) - Druckansicht - Seite 2 von 39

Uncore: Der Speicher-Controller (IMC)
Die Zahl der Kontakte im CPU-Sockel musste deutlich ansteigen, da Intel den Speicher-Controller vom Chipsatz in die Prozessoren verlagert hat. Dieser Schritt, welchen AMD bereits mit der Einführung der ersten Athlon 64-Generation vollzogen hatte, beseitigt ein Nadelöhr, welches Intels Plattformen bereits seit Jahren mit sich herumschleppen: Da der Arbeitsspeicher eine größere Bandbreite als seine Anbindung an den Speicher-Controller in der Northbridge des Chipsatzes und somit auch an die CPU selbst bietet, konnten weder Pentium 4/D, noch Conroe oder Penryn das Potential schneller Speicherriegel im Mehrkanalbetrieb voll ausschöpfen.

Speicherbandbreite: Single / Dual / Triple Channel in GB/s
DDR2-1600
12.80
25.60
38.40
DDR3-1333
10.60
21.20
31.80
DDR2/3-1066
8.50
17.00
25.50
DDR2/3-800
6.40
12.80
19.20
DDR2-667
5.30
10.60
DDR2-533
4.25
8.50
FSB1600
12.80
FSB1333
10.60
FSB1066
8.50
FSB800
6.40

Intel begnügt sich allerdings keinesfalls damit, den Speicher-Controller aus dem Chipsatz in die CPU zu verlagern, sondern erweitert seinen DDR3-Controller zugleich auf drei Kanäle. Während im Dual-Channel Betrieb zwei baugleiche DIMMs parallel angesprochen werden und sich die Speicheranbindung dabei von 64 auf 128 Bit verbreitert, haben wir es nun mit bis zu drei Speicherriegeln und einer 192 Bit breiten Anbindung zu tun. Inwiefern der Core i7 die gebotene Bandbreite ausnutzen kann und ob sich der Dreikanalbetrieb tatsächlich lohnt, wird eine der Fragen sein, welche unsere Messungen klären werden. Das Schicksal der im Workstation- und Server-Sektor genutzten FB-DIMMs scheint indes besiegelt: Zunächst wird es keine CPUs mit einem Speicher-Controller für FB-DIMMs geben. Falls der Markt es verlangt, könnte man ein solches Produkt nachreichen, erklärte Intel uns gegenüber.


Fotostrecke mit weiteren und größeren Fotos...

Drei Speicherkanäle bedeuten allerdings auch mehr Datenleitungen und ein aufwändigeres Layout der Hauptplatinen. Da mit steigendem Speichertakt auch die physikalischen Grenzen bezüglich des Datensignals näher rücken, wird Intels neue Plattform zumindest offiziell nur Taktraten bis DDR3-1066 unterstützen. Dank der direkten Anbindung an den Prozessor und des dritten Kanals sollte der Core i7 der Penryn-Generation in Bezug auf die Speicherbandbreite dennoch deutlich überlegen sein.


Fotostrecke mit weiteren und größeren Fotos...

Da die Speicherriegel den jeweiligen Speicherkanal zugleich auch terminieren, müssen zunächst jene Sockel bestückt werden, welche am weitesten vom CPU-Sockel entfernt liegen. Die maximale Speicherkapazität pro Modul beträgt 2 GByte, pro Kanal sind zwei Module möglich, was bei drei Speicherkanälen 3 x 2 x 2 GByte = 12 GByte ergibt. Mit Dual-CPU-Konfigurationen, welche Intel für den Server- und Workstationbereich vorstellen wird, sind analog hierzu 2 x 12 GByte = 24 GByte realisierbar.

Die Verlagerung des Speicher-Controllers hat alledings auch Auswirkungen auf das Übertakten: Hochgezüchteter DDR3-Speicher benötigt oftmals Spannungen von 1,80 bis 2,00 Volt, obwohl laut Spezifikation der JEDEC lediglich 1,50 Volt vorgesehen sind. Bisher lief man beim Übertakten mit solch hohen Spannungen "lediglich" Gefahr, den Chipsatz und somit das Mainboard zu beschädigen. Beim Core i7 grillt man im Ernstfall den Prozessor, ein zumeist ungleich teureres "Vergnügen". Intel hat uns eine maximale Spannung von 1,60 Volt nahegelegt, wodurch viele ältere DDR3-Module disqualifiziert wären. Auf der anderen Seite stehen im BIOS des Motherboards "Intel Extreme DX58SO" Spannungen von bis zu 2,50 Volt zur Auswahl, was nicht wirklich zusammen passt. Sozusagen frei nach dem Motto: "Feuer ist gefährlich, liebe Kinder. Also macht mit diesem Feuerzeug und diesen Streichhölzern keinen Unsinn, während Mutti und ich im Kino sind."


Fotostrecke mit weiteren und größeren Fotos...

Der letzte Knackpunkt betrifft Intels Plattformstrategie: Erinnern wir uns zurück an AMDs erste Athlon 64 Prozesoren, als zunächst der Sockel 940 mit einem Dual-Channel Speicher-Controller als Premium-Plattform präsentiert wurde. Hierbei handelte es sich eigentlich um Workstation-CPUs der Opteron-Baureihe, während die Single-Channel Plattform mit dem Sockel 754 für den mittleren Preisbereich vorgesehen war. Auch Intels Sockel LGA1366 und der dazugehörige Core i7 (Bloomfield) stellen eine solche Premium-Plattform dar, die aus dem Workstation-Bereich stammt. Für den Massenmarkt wird es andere Chipsätze, Sockel und Prozessoren geben, welche nur zwei Speicherkanäle unterstützen. Insbesondere in Hinblick auf die Zukunftssicherheit ist eine solche mehrgleisige Sockelstrategie riskant.




Intel Core i7 Extreme 965, 940 und 920 im Test (Bloomfield) - Druckansicht - Seite 3 von 39

Core/Uncore: 3-stufige Cache-Architektur
Sowohl der 65 nm Kentsfield als auch der 45 nm Yorkfield setzten sich aus zwei Dual-Cores zusammen, welche Intel auf ein PCB gepflanzt hatte. Aus diesem Grund gab es auch keinen gemeinsamen Cache aller vier Kerne, die Kerne konnten lediglich paarweise einen gemeinsamen L2-Cache nutzen. AMDs Phenom ist hingegen ein monolithischer Prozessor, dessen drei oder vier Kerne einen gemeinsamen L3-Cache besitzen. Dieser theoretische Vorteil brachte dem Phenom zwar nicht die Leistungskrone, doch die Vorzüge eines gemeinsamen L3-Caches lassen sich nicht bestreiten.


Fotostrecke mit weiteren und größeren Fotos...

Und so kommt es, dass Intel nicht nur den Speicher-Controller in die CPU verlagert, sondern auch eine 3-stufige Cache-Architektur einführt. Der L3-Cache ist 8 MByte groß und somit um ein Drittel kleiner als der 12 MByte große L2-Cache der schnellsten Yorkfields (Penryn). Es handelt sich um einen inklusiven Cache, dies bedeutet, dass alle im L1- und L2-Cache enthaltenen Adressen auch im dritten Cache-Level zu finden sind. Dies beschleunigt den Zugriff auf solche Daten, da ein On-Die Snoop-Filter zum Einsatz kommt und ungezielte Snoops auf andere Kerne überflüssig werden. Nur wenn das entsprechende Core Valid Bit im Level 3 Cache gesetzt ist, wird auch ein Snoop ausgeführt. Erweitert Intel später die Zahl der Kerne oder der Sockel im System, vergößert sich somit nicht auch automatisch der Snoop-Traffic.


Fotostrecke mit weiteren und größeren Fotos...

Die beiden weiteren Cache-Ebenen befinden sich natürlich nicht im Uncore, sondern in den jeweiligen Kernen: Jedem der vier Kerne stehen 256 KByte L2-Cache zur Verfügung, welche sowohl Befehle als auch Daten (unified Cache) enthalten. Durch diesen L2-Cache wird nicht nur der L3-Cache entlastet, jeder Kern erhält zudem eine eigene Ablage mit sehr schnellen Zugriffszeiten. Intel spricht in diesem Zusammenhang von 10 Zyklen (Load-to-use). Die erste Cache-Ebene setzt sich wie gehabt aus 32 KByte Instruktions- und 32 KByte Daten-Cache zusammen. Dabei bleibt der L1-Cache im Vergleich zum Penryn beinahe unverändert, beim Nehalem sind lediglich mehr parallele L1-Misses (erfolglose Anfragen) möglich. Mit einer wachsenden Zahl an Kernen ist dies sinnvoll, damit solche Fehlanfragen den Kern nicht ausbremsen.

Selbst wenn wir L2- und L3-Cache addieren, besitzt der Yorkfield auch weiterhin 3 MByte mehr Cache. Dies erklärt auch, warum der Bloomfield lediglich 731 Millionen Transistoren besitzt, während der Yorkfield auf 2x 410 Millionen Transistoren kommt.

Core: 2nd Level Unified TLB
Moderne Computer arbeiten mit virtuellem Speicher, so dass die virtuellen in physikalische Adressen umgerechnet werden müssen. Da diese Arbeit immer wieder anfällt und rechenintensiv ist, werden die Ergebnisse im Translation Lookaside Buffer (TLB) gepuffert. Der Penryn besitzt zwei 1st Level TLBs, einen für Instruktionen und einen zweiten für Daten. Beim Nehalem wurde diese Architektur um einen zweiten Level erweitert, wobei der 2nd Level TLB sowohl für Befehle als auch für Daten genutzt wird.


Fotostrecke mit weiteren und größeren Fotos...

Der 2nd Level TLB bietet Platz für 512 Einträge und soll hierdurch die Leistung im Zusammenspiel mit besonders ausufernden Anwendungen verbessern. Denn wenn die Resourcen der ersten TLB-Ebene nicht mehr ausreichen, müssen physikalische Speicheradressen wieder häufiger berechnet werden.

Uncore: Quick Path Interconnect (QPI)
Da der traditionelle Frontsidebus ausgedient hat, benötigt Intel eine neue Anbindung für die Kommunikation zwischen CPU und Chipsatz. Beim Bloomfield, der eigentlich eine Workstation-Plattform ist, setzt Intel auf Quick Path Interconnect (QPI). Diese serielle Punkt-zu-Punkt-Anbindung ermöglicht nicht nur die Kommunikation zwischen CPU und Chipsatz, sondern auch zwischen mehreren Prozessoren untereinander. Aktuell ist die Zahl der Anbindungen auf zwei begrenzt, somit lassen sich mit QPI zwei Prozessoren und ein Chipsatz verbinden.


Fotostrecke mit weiteren und größeren Fotos...

Die TX- und RX-Links sind jeweils 20 Bit breit: 16 Bit werden für Daten genutzt und 2 Bit für das Protokoll, hinzu kommen zwei Prüfbit (CRC). Quick Path Interconnect arbeitet pro Richtung mit einer maximalen Bandbreite von 6,4 GT/s bzw. 12,8 GB/s, da es sich um eine bidirektionale Kommunikation handelt, stehen bis zu 25,6 GB/s zur Verfügung - für die Zukunft verspricht Intel sogar noch höhere Bandbreiten. Im Desktop-Bereich wird nur der Core i7 Extreme 965 über die vollen 6,4 GT/s und eine mit 3,2 GHz getaktete QPI-Anbindung verfügen. Die preiswerteren Modelle 940 und 920 müssen sich mit 4,8 GT/s bzw. 2,4 GHz begnügen.

Bleibt noch eine Frage: Wird Intels nächste Mainstream-Plattform ebenfalls QPI verwenden? Die Antwort lautet: Nein, QPI wird ausschließlich beim Bloomfield sowie bei Intels neuer Xeon-Generation zum Einsatz kommen. Im Mainstream-Segment, wo solch hohe Bandbreiten nicht benötigt werden, wird Intel auf eine simplere Lösung setzen.




Intel Core i7 Extreme 965, 940 und 920 im Test (Bloomfield) - Druckansicht - Seite 4 von 39

Uncore: Power Control Unit (PCU)
Der Energie-Controller (PCU) des Nehalem wird von Intel als CPU innerhalb der CPU bezeichnet. Er besitzt mehr Transistoren als ein 486er Prozessor und überwacht neben den digitalen Temperatursensoren auch die Stromstärke und den Stromverbrauch des Prozessors. Wie bei den bisherigen Core-Prozessoren wurde auch beim Nehalem eine Temperaturschwelle (TJunction) hinterlegt, welche nicht überschritten werden darf. Bevor die CPU-Temperatur das Niveau von TJunction erreicht, wird die Drehzahl des Lüfters bis zum Maximum gesteigert, danach startet der Prozessor mit dem Throtteling und setzt mehr und mehr Zyklen aus. Wird TJunction dennoch erreicht, erfolgt die Notabschaltung, um eine Beschädigung der CPU zu verhindern.


Fotostrecke mit weiteren und größeren Fotos...

Anders verhält es sich bei der maximalen Stromstärke und dem Stromverbrauch des Prozessors. Hier kann der Benutzer im BIOS des Mainboards - auf eigenes Risiko versteht sich - einen höheren Grenzwert hinterlegen. Sofern die gewählte Kühlung ausreicht und TJunction nicht erreicht wird, darf die CPU die vom Hersteller vorgegebene TDP überschreiten. Für den Core i7 Extreme 965 nennt Intel beispielsweise eine TDP von 130 Watt.


Fotostrecke mit weiteren und größeren Fotos...

Doch nicht jeder will zusätzlichen Strom verheizen, viele Kunden legen mehr Wert auf eine genügsame Architektur. Während der Ruhemodus C6 beim Penryn nur für Mobilplattformen geboten wurde, beherrschen beim Nehalem auch die Desktop- und Workstation-CPUs diesen besonders tiefen Ruhezustand. Im C6 verbraucht der Prozessor so gut wie keinen Strom, da hier selbst die Power Gates abgeschaltet und damit auch Leckströme unterbunden werden. Beim Nehalem besitzt folglich jeder Kern eine eigene Powerplane. So kann ein Kern arbeiten, während die drei weiteren bis in den C6 heruntergeschaltet werden. Beim Penryn teilten sich je zwei Kerne eine Powerplane und konnten den Zustand daher nicht unabhängig vom anderen Kern wechseln.

Die maximale Energieersparnis wird in dem Moment erreicht, wenn alle vier Kerne in den C6 eintreten, denn dann kann auch der Uncore in den Ruhemodus wechseln. Intel bezeichnet dies als "Package to C6". Zur weiteren Absenkung des Idle-Verbrauchs können auch die Speicher-, QPI- und PCI-Express-Anbindungen reduziert werden, die CPU kann auch dem Spannungswandler signalisieren, die Zahl der aktiven Phasen zu vermindern.

Uncore: Turbo Modus
Eng mit dem Power-Management ist auch der Turbo-Modus verbunden. Dieser unterscheidet sich deutlich vom Turbo Modus des mobilen Penryn, denn ab sofort steht diese Funktion auf allen Plattformen zur Verfügung. Beim Penryn wurde lediglich ein Kern um eine Multiplikatorstufe hochgetaktet, wenn der andere Kern unbelastet war. Der Nehalem erweist sich als deutlich flexibler und kann auch den Takt aller vier Kerne erhöhen, solange die maximale TDP eingehalten wird.


Fotostrecke mit weiteren und größeren Fotos...

Beim Core i7 920 und Core i7 940 kann der Takt aller Kerne um eine Stufe (= 133 MHz) angehoben werden. Sofern nicht alle Kerne aktiv sind, kann einer der Kerne um zwei Stufen (= 266 MHz) hochtakten. Dies funktioniert natürlich nur solange, wie sich Abwärme und Stromstärke innerhalb der spezifizierten Grenzen bewegen. Die Überwachung dieser Werte übernimmt der Energie-Controller (PCU).


Fotostrecke mit weiteren und größeren Fotos...

Beim Core i7 Extreme 965 lassen sich der maximale Multiplikator und die TDP-Grenze anheben. Wer noch mehr Leistung herauskitzeln will, kann zudem die CPU-Spannung und den Referenztakt steigern. Dieser Referenztakt liegt bei 133 MHz, so dass der mit 3,2 GHz getaktete Core i7 Extreme beispielsweise einen Multiplikator von 24 verwendet. Doch selbst wenn man sich innerhalb der von Intel spezifizierten TDP von 130 Watt bewegt, bedeutet dies keinesfalls, dass die Übertaktung gelingen wird. Wählten wir den Multiplikator zu hoch, sahen wir uns bereits beim Systemstart mit Abstürzen konfrontiert.




Intel Core i7 Extreme 965, 940 und 920 im Test (Bloomfield) - Druckansicht - Seite 5 von 39

Core: Hyperthreading (SMT)
Eine Wiederauferstehung feiert die Hyperthreading-Technologie (aka: Simultaneous Multi-Threading). Erstmals beim 130 nm Pentium 4 mit Northwood Kern eingeführt, stellte Hyperthreading eine Vorstufe moderner Mehrkern-Prozessoren dar. Beim Hyperthreading befinden sich in jedem Kern parallele Verarbeitungsstrukturen, welche die zeitgleiche Bearbeitung von zwei Threads pro Kern ermöglichen. Somit besitzen die Bloomfields zwar nur vier physikalische aber acht logische Kerne.


Fotostrecke mit weiteren und größeren Fotos...

Hyperthreading ist jedoch keinesfalls der Königsweg, denn die Performance eines echten zweiten Kerns darf man von dieser Technologie nicht erwarten. In erster Linie soll Hyperthreading für eine bessere Auslastung der CPU-Resourcen - also der 4-Wide Execution-Engine - sorgen und somit die Effizienz der Prozessoren steigern. Die für Hyperthreading notwendigen Erweiterungen erhöhen die Transistorenzahl um weniger als zehn Prozent, sollte die durchschnittliche Leistungssteigerung über zehn Prozent liegen, geht Intels Rechnung auf.


Fotostrecke mit weiteren und größeren Fotos...

4-Wide Dynamic Execution und Macrofusion
Unter dem Namen "Dynamic Execution" fasste Intel beim Pentium III verschiedene Techniken zusammen, die zum Teil schon mit dem Pentium Pro eingeführt worden waren. Diese Techniken wurden dann für die Netburst Architektur in Form der "Advanced Dynamic Execution" auf eine lange Pipeline optimiert. Während alle Intel Prozessoren vom Pentium Pro über den Pentium 4 und D bis zum Pentium M (und auch AMDs Athlon und Athlon 64) ein dreifach superskalares Design verwenden - "Super Scalar" beschreibt eine Rechnerarchitektur, die in der Lage ist, mehrere Befehle zeitgleich bearbeiten zu können -, arbeiten die CPUs der Core-Mikroarchitektur mit einem vierfach superskalarem Design (4-Wide Dynamic Execution). Doch Intel begnügt sich nicht mit einer vierfach superskalaren Architektur, sondern kann sogar bis zu fünf Befehle pro Taktzyklus bearbeiten. Hierzu verwendet Intel eine Funktion namens "Macrofusion", durch die typische x86-Befehlsfolgen (Macro-Ops) zu einer einzelnen internen Instruktion (Micro-Op) zusammengefasst werden.

Der Penryn konnte Macrofusion anwenden, wenn auf eine Test- oder Vergleichsanweisung eine hiervon abhängige Verzweigung folgte, es wurden jedoch nicht alle möglichen Fälle abgedeckt. Beim Nehalem kommen die Varianten JL/JNGE, JGE/JNL, JLE/JNG und JG/JNLE hinzu, so dass Macrofusion öfter zur Anwendung kommt. Zudem wird Macrofusion nun auch im 64-Bit Betrieb unterstützt und ist nicht mehr auf 32-Bit limitiert. Doch auch abseits von Macrofusion kann jeder der vier Kerne vier Befehle pro Taktzylkus ausführen, was zusammen sechzehn ergibt.

Während der x86-Programmcode aus komplexen Instruktionen (CISC = Complex Instruction Set Computing) - also den Macro-Ops - besteht, werden diese zur internen Verarbeitung in einfache Strukturen aufgebrochen. Dabei handelt es sich um die RISC-ähnlichen (Reduced Instruction Set Computing) Micro-Ops. Diese Micro-Ops gehen dann zur weiteren Verarbeitung in die Pipeline des Prozessors. An dieser Stelle greift nun die "Mikro-Op Fusion", die Micro-Ops, welche aus der selben Macro-Op stammen, zusammenfassen kann und somit zu einer weiteren Effizienzsteigerung beiträgt.

Loop Stream Detector
Überarbeitet wurde die Schleifenerkennung der bisherigen Core-Prozessoren. Schleifen sind in der Programmierung allgegenwärtig und für Prozessoren bedeuten sie eine stetige Abarbeitung identischer Befehlsfolgen. Die Erkennung von Schleifen ist somit sinnvoll, da man einige der repetitiven Arbeitsschritte einsparen kann. Der Penryn ging folgendermaßen vor:


Fotostrecke mit weiteren und größeren Fotos...

Beim Nehalem hat Intel einfach die Positionen des Decode und der Schleifenerkennung vertauscht und somit einen weiteren Arbeitsschritt eingespart:


Fotostrecke mit weiteren und größeren Fotos...

Hardware Prefetching (HWP)
Mit Hardware Prefetching kann man Speicherlatenzen verbergen, indem man die CPU vorrausschauend arbeiten lässt. Die Prefetcher des Nehalem basieren auf denen des Penryn und wurden lediglich in Details verbessert. So erkennt der Nehalem, wenn der L2-Prefetcher ins Leere läuft. Einige Anwendungen, insbesondere im Serverbereich, reagierten auf ein fehlgeleitetes Prefetching mit deutlichen Leistungseinbußen, so dass es je nach Konfiguration sogar sinnvoll war, HWP zu unterbinden. Dies ist nun dank "Efficient Prefetch" nicht mehr notwendig. Zudem sollen die Prefetcher nun schneller auf Änderungen reagieren und generell aggressiver arbeiten.

SSE 4.2
Der Nehalem besitzt die Befehlssatzerweiterung SSE in der Version 4.2. Hinzugekommen sind lediglich sieben neue Instruktionen, welche die Bereiche CRC32, POPCNT und STTNI umfassen. STTNI (STring & Text New Instructions) beschleunigt die Verarbeitung von Zeichenketten und soll beispielsweise ein schnelleres Parsen von XML-Strukturen ermöglichen. Mit POPCNT lässt sich die Zahl aller Bits innerhalb einer Quelle ermitteln, welche nicht gleich Null sind. Sollen große Datenmengen, beispielsweise bei der Spracherkennung, verarbeitet werden, kann man reine Null-Nummern zügig aussortieren. CRC32 ersetzt komplexe Befehlsketten bei der Berechnung aktualisierter Checksummen.

Virtualisierung
Auch die Virtualisierungsfähigkeiten wurden weiter verbessert. Intel hat beispielsweise die Latenzen deutlich reduziert und das Page Table Management nun ebenfalls virtualisiert. Zudem müssen bei Übergängen die TLBs nicht mehr geflushed werden, da der Nehalem eine virtuelle Processor ID (VPID) verwendet.


Fotostrecke mit weiteren und größeren Fotos...

Ausblick bis 2010
Auf ein Tock folgt bei Intel ein Tick, was einer Optimierung der vorhandenen Architektur sowie einer Verkleinerung der Fertigungsstrukturen entspricht. 2009 will Intel den 45 nm Nehalem auf 32 nm schrumpfen und als Westmere vorstellen. Im Jahr 2010 folgt dann wieder eine neue Architektur, der ebenfalls im 32 nm Prozess gefertigte Sandy Bridge.




Intel Core i7 Extreme 965, 940 und 920 im Test (Bloomfield) - Druckansicht - Seite 6 von 39

Testkonfiguration #1
Unser Testsystem basiert auf dem Motherboard Intel Extreme DX58SO, welches die neue X58 Northbridge mit der vom P45 Chipsatz bekannten Southbridge ICH10R kombiniert:


Fotostrecke mit weiteren und größeren Fotos...

Die Grafikkarte R4870X2-T2D2G-OC stammt von MSI, sie besitzt zwei Grafikprozessoren vom Typ ATi Radeon HD 4870:


Fotostrecke mit weiteren und größeren Fotos...

Drei baugleiche DDR3-1066 CL7 Speicherriegel von Qimonda ermöglichen den Betrieb mit einem, zwei sowie drei Speicherkanälen:


Fotostrecke mit weiteren und größeren Fotos...

Der Intel Core i7 Extreme 965 war bereits auf dem Mainboard verbaut, als uns dieses erreichte:


Fotostrecke mit weiteren und größeren Fotos...

Statt eines eigenen Kühlers packte Intel für diesen Prozessor einen Thermalright Ultra-120 eXtreme bei:


Fotostrecke mit weiteren und größeren Fotos...

Dieser Kühler bietet einen ausreichenden Spielraum für Übertaktungsversuche, bei der Montage wird er mit dem Motherboard verschraubt.




Intel Core i7 Extreme 965, 940 und 920 im Test (Bloomfield) - Druckansicht - Seite 7 von 39

Testkonfiguration #2
Den Core i7 920 lieferte Intel hingegen in der Box inklusive des dazugehörigen Kühlers:


Fotostrecke mit weiteren und größeren Fotos...

Um für spätere Tests ausreichende Leistungsreserven zu haben, wählten wir das Netzteil be quiet! Dark Power Pro 1000 Watt:


Fotostrecke be quiet! Dark Power Pro 1000W mit weiteren und größeren Fotos...

Hier alle Komponenten des Testsystems in der Übersicht:

Für das Sockel LGA775 Vergleichssystem verwenden wir das Mainboard ASUS P5E3 Premium auf Basis des Intel X48 Chipsatzes. Die Vergleichsprozessoren sind ein Intel Core 2 Extreme QX9770 (45 nm Yorkfield) und ein Intel Core 2 Extreme QX6800 (65 nm Kentsfield).


Fotostrecke ASUS P5E3 Premium mit weiteren und größeren Fotos...

Probleme
Da es sich beim Nehalem um eine ganz junge Plattform handelt, verwundert es kaum, dass wir bei unserem Test über einige Probleme gestolpert sind. Anfängliche Instabilitäten konnten wir dadurch lösen, dass wir auf den Einsatz von Energiesparlampen im Testraum verzichtet haben. Dieses Problem trat natürlich nur beim offenen Aufbau des Systems auf, wurde die Plattform in einem Gehäuse verbaut, gab es keine Wechselwirkung mit den Energiesparlampen.

Crossfire und SLI
Intels X58 Chipsatz unterstützt AMDs CrossFireX-Technologie, so dass Grafikkarten mit einer ATi Radeon GPU zu einem CrossFire-Verbund gekoppelt werden können. Doch was ist mit NVIDIAs SLI? Während Intels Chipsätze X975, X38 und X48 auf SLI verzichten mussten, bestand bei der Dual-CPU-Plattform "Skulltrail" zumindest die Möglichkeit, einen NV100 PCI-Express-Controller von NVIDIA zu verbauen und das Mainboard damit um SLI zu bereichern. Auch für den X58 Chipsatz hat Intel keine SLI-Lizenz bekommen, doch da NVIDIA keinen Chipsatz für diese Plattfom anbieten wird, bestehen für die Mainboard-Hersteller nun drei Möglichkeiten:

  1. Der Hersteller verzichtet auf SLI und kann sein Mainboard besonders preiswert anbieten.
  2. Der Hersteller erwirbt eine SLI-Lizenz von NVIDIA, NVIDIA validiert das Mainboard und schaltet das BIOS für SLI frei.
  3. Der Hersteller verbaut NVIDIAs PCI-Express 2.0-Controller NV200 auf seinem Mainboard und erhält hierdurch eine SLI-Lizenz.

Intels Extreme Motherboard DX58SO, welches wir für unseren Test verwenden, verzichtet auf SLI, so dass lediglich CrossFireX möglich ist.




Intel Core i7 Extreme 965, 940 und 920 im Test (Bloomfield) - Druckansicht - Seite 8 von 39

SiSoft Sandra 2009 Arithmetik
Bevor wir uns Anwendungen und Spielen zuwenden, werden wir einige synthetische Benchmarks durchführen. Deren Ergebnisse geben zwar lediglich einen groben Anhaltspunkt für die tatsächliche Performance im Alltagsbetrieb, doch sie eignen sich gut als Maßstab dafür, was wir in den anderen Messungen maximal erwarten dürfen.

Taktung und Architektur
Um die Leistungsmessungen etwas übersichtlicher aufzubreiten, haben wir sie in unterschiedliche Schwerpunkte gegliedert. Im ersten Diagramm stehen die verschiedenen Architekturen und Taktraten im Vordergrund. Um eine bessere Vergleichbarkeit zu gewährleisten, haben wir den Turbo Modus in allen Durchläufen des Core i7 deaktiviert.

SiSoft Sandra 2009 Arithmetik: Dhrystone iSSE4.2 in GIPS; Whetstone iSSE3 in GFLOPS
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
77.82
66.22
Core i7 940
2,93GHz fix/HT
DDR3-1066CL7/3Ch
71.34
59.92
Core i7 920
2,66GHz fix/HT
DDR3-1066CL7/3Ch
64.78
55.11
Core 2 QX9770
3,20GHz fix/no HT
DDR3-1333CL8/2Ch
58.91
43.10
Core 2 QX6800
2,93GHz fix/no HT
DDR3-1066CL7/2Ch
47.98
34.50

Nehmen wir das Ergebnis des Core i7 Extreme 965 als 100 Prozent, so erreicht der Core i7 940 noch 91 Prozent von dessen Leistung, beim Einstiegsmodell Core i7 920 sind es immerhin noch 83 Prozent. Diese Skalierung stimmt ziemlich genau mit den Taktraten der drei Prozessoren überein.
Ausgehend vom Core 2 Extreme QX9770 zeigt der Core i7 Extreme 965 im Ganzzahlendurchlauf eine Leistungssteigerung um 32 Prozent, bei den Gleitkommaberechnungen sind es sogar mehr als 53 Prozent. Selbst dem mit lediglich 2,66 GHz getakteten Core i7 920 muss sich das Top-Modell der Penryn-Generation geschlagen geben.

Turbo Modus
Der Turbo Modus hebt bei Core i7 Prozessoren den Takt der Kerne um maximal eine Stufe bzw. 133,33 MHz an. Wird nur ein Kern belastet, sind auch zwei Stufen bzw. 266,66 MHz möglich. Für den Core i7 920 bedeutet dies eine theoretische Leistungssteigerung um 5 bis 10 Prozent, für höher getaktete Modelle fällt der prozentuale Zuwachs entsprechend geringer aus. Beim Spitzenmodell Core i7 Extreme 965 wären es lediglich 4,17 bis 8,33 Prozent, weshalb wir dort manuell eine Steigerung um drei Stufen bzw. 400 MHz (12,5 Prozent) freigegeben haben. Diese manuelle Anhebung ist nur bei der Extreme-Version möglich.

SiSoft Sandra 2009 Arithmetik: Dhrystone iSSE4.2 in GIPS; Whetstone iSSE3 in GFLOPS
Core i7 965
3,20GHz dyn/HT
DDR3-1066CL7/3Ch
86.98
74.61
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
77.82
66.22
Core i7 940
2,93GHz dyn/HT
DDR3-1066CL7/3Ch
74.68
63.60
Core i7 940
2,93GHz fix/HT
DDR3-1066CL7/3Ch
71.34
59.92
Core i7 920
2,66GHz dyn/HT
DDR3-1066CL7/3Ch
68.07
58.12
Core i7 920
2,66GHz fix/HT
DDR3-1066CL7/3Ch
64.78
55.11

Mit Hilfe des Turbo Modus erreichen wir beim Core i7 Extreme 965 ca. 112 Prozent der ursprüglichen Leistung. Dies gelingt jedoch nur, da wir den Spielraum manuell erweitert haben. Beim Core i7 920 und Core i7 940 zeigen sich Leistungsgewinne von etwas mehr als 5 Prozent.

Hyperthreading
Der dritte Schwerpunkt ist Hyperthreading, denn während diese Funktion für Anwendungen, welche mehr als vier Kerne nutzen können, ein Segen ist, kommen einige Programme, welche weniger Kerne auslasten, zuweilen ins Straucheln.

SiSoft Sandra 2009 Arithmetik: Dhrystone iSSE4.2 in GIPS; Whetstone iSSE3 in GFLOPS
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
77.82
66.22
Core i7 965
3,20GHz fix/no HT
DDR3-1066CL7/3Ch
78.69
40.19
Core 2 QX9770
3,20GHz fix/no HT
DDR3-1333CL8/2Ch
58.91
43.10

Während Sandra für den Ganzzahlen-Durchlauf "Dhrystone iSSE4.2" augenscheinlich nur vier Threads verwendet und das Ergebnis konstant bleibt, bricht die Wertung für den Gleitkomma-Test "Whetstone iSSE3" um mehr als ein Drittel ein. Im Vergleich zum Core 2 Extreme QX9770 zeigt sich deutlich, dass der Vorsprung des Core i7 in der Gleitkomma-Messung ausschließlich auf Hyperthreading basiert, während die Ganzzahlen-Berechnung auch ohne diesen "Trick" um ein Drittel zulegen konnte.

Speicherbandbreite
Auch die Speicherbandbreite kann einen Einfluss auf die Leistungsmessungen haben. Intels Core i7 unterstützt maximal drei Speicherkanäle, welche wir jeweils mit 1 GByte DDR3-1066 CL7-7-7-21 Modulen von Qimonda bestückt haben. Für die Durchläufe mit zwei und einem Speicherkanal kommen je zwei dieser Speicherriegel zum Einsatz. Hinzu kommt eine 3-Kanal-Messung, bei der wir den Speicher auf DDR3-1333 CL8-8-8-24 übertaktet haben.

SiSoft Sandra 2009 Arithmetik: Dhrystone iSSE4.2 in GIPS; Whetstone iSSE3 in GFLOPS
Core i7 965
3,20GHz fix/HT
DDR3-1333CL8/3Ch
77.73
66.30
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
77.82
66.22
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/2Ch
77.85
66.16
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/1Ch
77.80
66.19

Auf die Rechenleistung des Core i7 hat die Speicherbandbreite keinen Einfluss. Dies war zwar auch nicht zu erwarten, doch ab und an gibt es geringe Reaktionen, wenn der Verwaltungsaufwand für den schnelleren Speicher die CPU belastet.




Intel Core i7 Extreme 965, 940 und 920 im Test (Bloomfield) - Druckansicht - Seite 9 von 39

SiSoft Sandra 2009 Multimedia
Wir bleiben bei den synthetischen Messungen und betrachten nun typische Multimedia-Berechnungen.

Taktung und Architektur
Um die Leistungsmessungen etwas übersichtlicher aufzubreiten, haben wir sie in unterschiedliche Schwerpunkte gegliedert. Im ersten Diagramm stehen die verschiedenen Architekturen und Taktraten im Vordergrund. Um eine bessere Vergleichbarkeit zu gewährleisten, haben wir den Turbo Modus in allen Durchläufen des Core i7 deaktiviert.

SiSoft Sandra 2009 Multimedia: Integer x16 iSSE4.1; Fließkomma x8 iSSE2; Double x4 iSSE2 in MPixel/s
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
161.26
124.84
68.60
Core i7 940
2,93GHz fix/HT
DDR3-1066CL7/3Ch
147.63
114.37
62.85
Core i7 920
2,66GHz fix/HT
DDR3-1066CL7/3Ch
134.21
103.86
57.08
Core 2 QX9770
3,20GHz fix/no HT
DDR3-1333CL8/2Ch
147.99
102.09
52.86
Core 2 QX6800
2,93GHz fix/no HT
DDR3-1066CL7/2Ch
97.31
93.64
49.00

Nehmen wir wieder die Resultate des Core i7 Extreme 965 als 100 Prozent, so erreicht der Core i7 940 noch gut 91 Prozent von dessen Leistung. Beim Einstiegsmodell Core i7 920 sind es über 83 Prozent, so dass wir abermals eine ziemlich perfekte Skalierung sehen.
Nehmen wir nun den Core 2 Extreme QX9770 als 100 Prozent an, so übertrifft der Core i7 Extreme 965 dessen Werte um knapp 9 (Integer x16), 22 (Fließkomma x8) sowie knapp 30 Prozent (Double x4). Damit ordnet sich das Top-Modell der Penryn-Generation zwischen Core i7 920 und Core i7 940 ein.

Turbo Modus
Der Turbo Modus hebt bei Core i7 Prozessoren den Takt der Kerne um maximal eine Stufe bzw. 133,33 MHz an. Wird nur ein Kern belastet, sind auch zwei Stufen bzw. 266,66 MHz möglich. Für den Core i7 920 bedeutet dies eine theoretische Leistungssteigerung um 5 bis 10 Prozent, für höher getaktete Modelle fällt der prozentuale Zuwachs entsprechend geringer aus. Beim Spitzenmodell Core i7 Extreme 965 wären es lediglich 4,17 bis 8,33 Prozent, weshalb wir dort manuell eine Steigerung um drei Stufen bzw. 400 MHz (12,5 Prozent) freigegeben haben. Diese manuelle Anhebung ist nur bei der Extreme-Version möglich.

SiSoft Sandra 2009 Multimedia: Integer x16 iSSE4.1; Fließkomma x8 iSSE2; Double x4 iSSE2 in MPixel/s
Core i7 965
3,20GHz dyn/HT
DDR3-1066CL7/3Ch
178.58
136.11
74.82
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
161.26
124.84
68.60
Core i7 940
2,93GHz dyn/HT
DDR3-1066CL7/3Ch
154.46
119.52
65.58
Core i7 940
2,93GHz fix/HT
DDR3-1066CL7/3Ch
147.63
114.37
62.85
Core i7 920
2,66GHz dyn/HT
DDR3-1066CL7/3Ch
141.16
109.17
60.03
Core i7 920
2,66GHz fix/HT
DDR3-1066CL7/3Ch
134.21
103.86
57.08

Mit dem Turbo Modus können wir die Leistung des Core i7 Extreme 965 um weitere 9 bis 10 Prozent anheben. Beim Core i7 940 sind es lediglich 4,50 Prozent, beim Core i7 920 zumindest 5,15 Prozent.

Hyperthreading
Der dritte Schwerpunkt ist Hyperthreading, denn während diese Funktion für Anwendungen, welche mehr als vier Kerne nutzen können, ein Segen ist, kommen einige Programme, welche weniger Kerne auslasten, zuweilen ins Straucheln.

SiSoft Sandra 2009 Multimedia: Integer x16 iSSE4.1; Fließkomma x8 iSSE2; Double x4 iSSE2 in MPixel/s
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
161.26
124.84
68.60
Core i7 965
3,20GHz fix/no HT
DDR3-1066CL7/3Ch
133.07
103.35
53.79
Core 2 QX9770
3,20GHz fix/no HT
DDR3-1333CL8/2Ch
147.99
102.09
52.86

Alle drei Multimediamessungen reagieren deutlich auf das Abschalten des Hyperthreading, so dass die Ergebnisse um ca. 20 Prozent einbrechen. So kann sich der Core 2 Extreme QX9770 im Ganzzahlen-Durchlauf nun einen Vorsprung von 10 Prozent erarbeiten und liegt in den Disziplinen Fließkomma und Double gleich auf.

Speicherbandbreite
Auch die Speicherbandbreite kann einen Einfluss auf die Leistungsmessungen haben. Intels Core i7 unterstützt maximal drei Speicherkanäle, welche wir jeweils mit 1 GByte DDR3-1066 CL7-7-7-21 Modulen von Qimonda bestückt haben. Für die Durchläufe mit zwei und einem Speicherkanal kommen je zwei dieser Speicherriegel zum Einsatz. Hinzu kommt eine 3-Kanal-Messung, bei der wir den Speicher auf DDR3-1333 CL8-8-8-24 übertaktet haben.

SiSoft Sandra 2009 Multimedia: Integer x16 iSSE4.1; Fließkomma x8 iSSE2; Double x4 iSSE2 in MPixel/s
Core i7 965
3,20GHz fix/HT
DDR3-1333CL8/3Ch
161.29
124.75
68.15
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
161.26
124.84
68.60
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/2Ch
161.33
124.75
68.60
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/1Ch
161.37
124.75
68.60

Abermals sehen wir keinen Einfluss der Speicherbandbreite auf die Rechenleistung des Core i7 Extreme 965.




Intel Core i7 Extreme 965, 940 und 920 im Test (Bloomfield) - Druckansicht - Seite 10 von 39

SiSoft Sandra 2009 Kryptographie
Kryptographie, also die Ver- und Entschlüsselung von Daten, ist eine weitere Disziplin, welche SiSoft Sandra 2009 messen kann. Getestet wird mit einer AES256 (Advanced Encryption Standard) Verschlüsselung und dem Secure Hash Algorithm (SHA256).

Taktung und Architektur
Um die Leistungsmessungen etwas übersichtlicher aufzubreiten, haben wir sie in unterschiedliche Schwerpunkte gegliedert. Im ersten Diagramm stehen die verschiedenen Architekturen und Taktraten im Vordergrund. Um eine bessere Vergleichbarkeit zu gewährleisten, haben wir den Turbo Modus in allen Durchläufen des Core i7 deaktiviert.

SiSoft Sandra 2009 Kryptographie: AES256; SHA256 in MB/s
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
575
536
Core i7 940
2,93GHz fix/HT
DDR3-1066CL7/3Ch
527
491
Core i7 920
2,66GHz fix/HT
DDR3-1066CL7/3Ch
479
446
Core 2 QX9770
3,20GHz fix/no HT
DDR3-1333CL8/2Ch
546
643
Core 2 QX6800
2,93GHz fix/no HT
DDR3-1066CL7/2Ch
501
588

Abermals skaliert der Core i7 streng nach seiner Taktung: Wir nehmen die Leistung des Core i7 Extreme 965 als 100 Prozent, notieren 91 Prozent für den Core i7 940 sowie 83 Prozent für das Einstiegsmodell Core i7 920.
Bezogen auf die Ergebnisse des Core 2 Extreme QX9770 ist der Datendurchsatz des Core i7 Extreme 965 bei der Verschlüsselung um 5,3 Prozent schneller, beim Hashing liegt Intels neues Top-CPU allerdings um erstaunliche 17 Prozent zurück.

Turbo Modus
Der Turbo Modus hebt bei Core i7 Prozessoren den Takt der Kerne um maximal eine Stufe bzw. 133,33 MHz an. Wird nur ein Kern belastet, sind auch zwei Stufen bzw. 266,66 MHz möglich. Für den Core i7 920 bedeutet dies eine theoretische Leistungssteigerung um 5 bis 10 Prozent, für höher getaktete Modelle fällt der prozentuale Zuwachs entsprechend geringer aus. Beim Spitzenmodell Core i7 Extreme 965 wären es lediglich 4,17 bis 8,33 Prozent, weshalb wir dort manuell eine Steigerung um drei Stufen bzw. 400 MHz (12,5 Prozent) freigegeben haben. Diese manuelle Anhebung ist nur bei der Extreme-Version möglich.

SiSoft Sandra 2009 Kryptographie: AES256; SHA256 in MB/s
Core i7 965
3,20GHz dyn/HT
DDR3-1066CL7/3Ch
620
603
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
575
536
Core i7 940
2,93GHz dyn/HT
DDR3-1066CL7/3Ch
549
513
Core i7 940
2,93GHz fix/HT
DDR3-1066CL7/3Ch
527
491
Core i7 920
2,66GHz dyn/HT
DDR3-1066CL7/3Ch
505
466
Core i7 920
2,66GHz fix/HT
DDR3-1066CL7/3Ch
479
446

Der Turbo Modus bringt uns beim Core i7 Extreme 965 knapp 8 bzw. gut 12 Prozent mehr Durchsatz. Beim Core i7 940 sind es magere 4,33 Prozent und auch die Leistung des Core i7 920 steigt um nicht einmal 5 Prozent an.

Hyperthreading
Der dritte Schwerpunkt ist Hyperthreading, denn während diese Funktion für Anwendungen, welche mehr als vier Kerne nutzen können, ein Segen ist, kommen einige Programme, welche weniger Kerne auslasten, zuweilen ins Straucheln.

SiSoft Sandra 2009 Kryptographie: AES256; SHA256 in MB/s
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
575
536
Core i7 965
3,20GHz fix/no HT
DDR3-1066CL7/3Ch
518
592
Core 2 QX9770
3,20GHz fix/no HT
DDR3-1333CL8/2Ch
546
643

Ohne Hyperthreading wird die Verschlüsselung lediglich 10 Prozent langsamer, das Hashing kann hingegen um gut 11 Prozent zulegen. Hier haben wir erstmals eine Disziplin, bei der Hyperthreading den Core i7 ausbremst. Doch auch ohne Hyperthreading, an dem sich das Hashing definitiv verschluckt, kann der Core i7 Extreme 965 nicht am Core 2 Extreme QX9770 vorbeiziehen. Der Penryn erreicht einen um 5 bis 8 Prozent höheren Datendurchsatz.

Speicherbandbreite
Auch die Speicherbandbreite kann einen Einfluss auf die Leistungsmessungen haben. Intels Core i7 unterstützt maximal drei Speicherkanäle, welche wir jeweils mit 1 GByte DDR3-1066 CL7-7-7-21 Modulen von Qimonda bestückt haben. Für die Durchläufe mit zwei und einem Speicherkanal kommen je zwei dieser Speicherriegel zum Einsatz. Hinzu kommt eine 3-Kanal-Messung, bei der wir den Speicher auf DDR3-1333 CL8-8-8-24 übertaktet haben.

SiSoft Sandra 2009 Kryptographie: AES256; SHA256 in MB/s
Core i7 965
3,20GHz fix/HT
DDR3-1333CL8/3Ch
576
536
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
575
536
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/2Ch
575
536
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/1Ch
575
536

Der Kryptographie-Test eignet sich übrigens wunderbar um zu zeigen, dass Speicherbandbreite zuweilen gar keinen Einfluss auf die Ergebnisse hat.




Intel Core i7 Extreme 965, 940 und 920 im Test (Bloomfield) - Druckansicht - Seite 11 von 39

SiSoft Sandra 2009 Speicherbandbreite
Durch die Integration des Speicher-Controllers in die CPU und die Verbreiterung der Speicheranbindung auf bis zu 3 Kanäle verzeichnet der Core i7 eine deutlich höhere Speicherbandbreite als der FSB-limitierte Penryn. Mit SiSoft Sandra 2009 messen wir nach, wieviel Bandbreite den Anwendungen zur Verfügung steht.

Taktung und Architektur
Um die Leistungsmessungen etwas übersichtlicher aufzubreiten, haben wir sie in unterschiedliche Schwerpunkte gegliedert. Im ersten Diagramm stehen die verschiedenen Architekturen und Taktraten im Vordergrund. Um eine bessere Vergleichbarkeit zu gewährleisten, haben wir den Turbo Modus in allen Durchläufen des Core i7 deaktiviert.

SiSoft Sandra 2009 Speicherbandbreite: Integer Buff'd iSSE2; Fließkomma Buff'd iSSE2 in GB/s
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
18.26
18.29
Core i7 940
2,93GHz fix/HT
DDR3-1066CL7/3Ch
18.19
18.22
Core i7 920
2,66GHz fix/HT
DDR3-1066CL7/3Ch
18.14
18.20
Core 2 QX9770
3,20GHz fix/no HT
DDR3-1333CL8/2Ch
7.53
7.51
Core 2 QX6800
2,93GHz fix/no HT
DDR3-1066CL7/2Ch
5.31
5.31

Beim Core i7 ist der Einfluss des Prozessortaktes auf den Speicherdurchsatz sehr gering. Wir messen bei den niedriger getakteten Modellen zwar geringere Werte, doch selbst zwischen einer Taktrate von 2,66 GHz und 3,20 GHz besteht nicht einmal 1 Prozent Unterschied. Den Vergleich mit den Core 2 Prozessoren nehmen wir weiter unten vor, wenn wir die verschiedenen Speicherkonfigurationen betrachten.

Turbo Modus
Der Turbo Modus hebt bei Core i7 Prozessoren den Takt der Kerne um maximal eine Stufe bzw. 133,33 MHz an. Wird nur ein Kern belastet, sind auch zwei Stufen bzw. 266,66 MHz möglich. Für den Core i7 920 bedeutet dies eine theoretische Leistungssteigerung um 5 bis 10 Prozent, für höher getaktete Modelle fällt der prozentuale Zuwachs entsprechend geringer aus. Beim Spitzenmodell Core i7 Extreme 965 wären es lediglich 4,17 bis 8,33 Prozent, weshalb wir dort manuell eine Steigerung um drei Stufen bzw. 400 MHz (12,5 Prozent) freigegeben haben. Diese manuelle Anhebung ist nur bei der Extreme-Version möglich.

SiSoft Sandra 2009 Speicherbandbreite: Integer Buff'd iSSE2; Fließkomma Buff'd iSSE2 in GB/s
Core i7 965
3,20GHz dyn/HT
DDR3-1066CL7/3Ch
18.26
18.28
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
18.26
18.29
Core i7 940
2,93GHz dyn/HT
DDR3-1066CL7/3Ch
18.19
18.24
Core i7 940
2,93GHz fix/HT
DDR3-1066CL7/3Ch
18.19
18.22
Core i7 920
2,66GHz dyn/HT
DDR3-1066CL7/3Ch
18.16
18.20
Core i7 920
2,66GHz fix/HT
DDR3-1066CL7/3Ch
18.14
18.20

Auf die Speicherbandbreite wirkt sich die Taktrate der Core i7 Prozessoren nur gering aus, somit bringt auch der Turbo Modus so gut wie keine Vorteile.

Hyperthreading
Der dritte Schwerpunkt ist Hyperthreading, denn während diese Funktion für Anwendungen, welche mehr als vier Kerne nutzen können, ein Segen ist, kommen einige Programme, welche weniger Kerne auslasten, zuweilen ins Straucheln.

SiSoft Sandra 2009 Speicherbandbreite: Integer Buff'd iSSE2; Fließkomma Buff'd iSSE2 in GB/s
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
18.26
18.29
Core i7 965
3,20GHz fix/no HT
DDR3-1066CL7/3Ch
18.35
18.37

Das Abschalten des Hyperthreading bringt eine minimale Steigerung des Speichertaktes um ca. 0,5 Prozent. Wahrscheinlich ist der geringere Verwaltungsaufwand für diesen Anstieg verantwortlich.

Speicherbandbreite
Auch die Speicherbandbreite kann einen Einfluss auf die Leistungsmessungen haben. Intels Core i7 unterstützt maximal drei Speicherkanäle, welche wir jeweils mit 1 GByte DDR3-1066 CL7-7-7-21 Modulen von Qimonda bestückt haben. Für die Durchläufe mit zwei und einem Speicherkanal kommen je zwei dieser Speicherriegel zum Einsatz. Hinzu kommt eine 3-Kanal-Messung, bei der wir den Speicher auf DDR3-1333 CL8-8-8-24 übertaktet haben.

SiSoft Sandra 2009 Speicherbandbreite: Integer Buff'd iSSE2; Fließkomma Buff'd iSSE2 in GB/s
Core i7 965
3,20GHz fix/HT
DDR3-1333CL8/3Ch
20.71
20.73
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
18.26
18.29
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/2Ch
12.90
12.95
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/1Ch
7.50
7.50
Core 2 QX9770
3,20GHz fix/no HT
DDR3-1333CL8/2Ch
7.53
7.51

Verwenden wir statt drei nur zwei Speicherkanäle, bricht der Durchsatz um knapp 30 Prozent ein. Wird nur ein Speicherkanal genutzt, was beispielsweise auch bei einer Bestückung mit vier Modulen der Fall ist, bleiben nur 41 Prozent der 3-Kanal-Bandbreite übrig. Das Übertakten des Speichers auf DDR3-1333 CL8, also eine Taktsteigerung um 25 Prozent, bewirkt einen Bandbreitenzuwachs um lediglich 13,4 Prozent. Ob sich diese Unterschiede auf Anwendungen ebenso dramatisch auswirken, werden uns die nachfolgenden Messungen verraten.

Gibt es einen besseren Beweis dafür, dass schneller Dual-Channel Arbeitsspeicher von der FSB-Architektur des Core 2 massiv ausgebremst wird? Der Core 2 Extreme QX9770 verwendet in diesem Vergleich DDR3-1333 CL8 Module im Dual-Channel-Betrieb und dennoch liegt sein Speicherdurchsatz nur auf dem Niveau des Core i7 Extreme 965 mit DDR3-1066 CL7 bei Verwendung eines einzigen Speicherkanals. In der Dual-Channel Konfiguration beträgt der Vorteil des Core i7 bereits 71,3 Prozent, mit drei Kanälen werden hieraus 142,5 Prozent und bei identischer Speichertaktrate sogar 175 Prozent.




Intel Core i7 Extreme 965, 940 und 920 im Test (Bloomfield) - Druckansicht - Seite 12 von 39

SiSoft Sandra 2009 Mehrkerneffizienz
AMDs Hauptargument für eine monolithische 4-Kern-Architektur war die schnellere Kommunikation zwischen den einzelnen Prozessorkernen. Während sich Intels 65 nm Kentsfield sowie der 45 nm Yorkfield aus zwei Dual-Core CPUs zusammensetzen, handelt es sich beim Nehalem ebenfalls um einen "echten" Quad-Core-Prozessr. SiSoft Sandra 2009 kann die Bandbreite und die Latenzzeit zwischen den Kernen messen und hier sollte der Core i7 im Vorteil sein.

SiSoft Sandra 2009: Bandbreite Kern-Kern in GB/s (höhere Werte sind besser)
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
38.25
Core i7 940
2,93GHz fix/HT
DDR3-1066CL7/3Ch
36.89
Core i7 920
2,66GHz fix/HT
DDR3-1066CL7/3Ch
36.11
Core 2 QX9770
3,20GHz fix/no HT
DDR3-1333CL8/2Ch
18.69
Core 2 QX6800
2,93GHz fix/no HT
DDR3-1066CL7/2Ch
13.59

Die Bandbreite zwischen den Kernen hat sich bei gleicher Taktrate verdoppelt, hier hat der Nehalem also einen klaren Architekturvorteil gegenüber dem Penryn. Zudem fällt auf, dass der Core i7 Extreme 965 lediglich 6 Prozent mehr Bandbreite bietet als der Core i7 920.

SiSoft Sandra 2009: Latenz Kern-Kern in ns (niedrigere Werte sind besser)
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
17
Core i7 940
2,93GHz fix/HT
DDR3-1066CL7/3Ch
18
Core i7 920
2,66GHz fix/HT
DDR3-1066CL7/3Ch
18
Core 2 QX9770
3,20GHz fix/no HT
DDR3-1333CL8/2Ch
36
Core 2 QX6800
2,93GHz fix/no HT
DDR3-1066CL7/2Ch
95

Passend zur doppelten Bandbreite wurden die Latenzen halbiert. Auffällig ist bei dieser Messung, dass Intels erste Quad-Core-Baureihe in Form des Core 2 Extreme QX6800 nochmals deutlich höhere Latenzen aufweist als der Core 2 Extreme QX9770.




Intel Core i7 Extreme 965, 940 und 920 im Test (Bloomfield) - Druckansicht - Seite 13 von 39

SiSoft Sandra 2009 Cache/Speicherlatenz
Interessant sind natürlich auch die Latenzen von Arbeitsspeicher und Cache, denn der Nehalem hat ja nicht nur einen integrierten Speicher-Controller bekommen, sondern auch eine dritte Cache-Ebene. Somit sollten die Latenzen von Speicher und Level 2 Cache deutlich geringer sein als beim Penryn. Spannend ist zudem die Frage, wo sich der Level 3 Cache einordnen wird.

SiSoft Sandra 2009: Latenz L1/L2/L3 in Clocks; Speicher in ns (niedrigere Werte sind besser)
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
4
11
53
76
Core i7 940
2,93GHz fix/HT
DDR3-1066CL7/3Ch
4
11
51
78
Core i7 920
2,66GHz fix/HT
DDR3-1066CL7/3Ch
4
11
48
80
Core 2 QX9770
3,20GHz fix/no HT
DDR3-1333CL8/2Ch
3
18
0
78
Core 2 QX6800
2,93GHz fix/no HT
DDR3-1066CL7/2Ch
3
15
0
92

Durch die Integration des L2-Caches in die Kerne konnte dessen Latenz um 60 Prozent verringert werden. Die Rolle des gemeinsamen Caches übernimmt der L3-Cache, der allerdings deutlich langsamer reagiert als der L2-Cache des Penryn. Bei der Speicherlatenz sehen wir bei gleicher Taktrate einen geringen Vorteil für den Nehalem.

SiSoft Sandra 2009: Bandbreite L1/L2/Cache-Speicher in GB/s (niedrigere Werte sind besser)
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
253.28
224.27
64.60
Core i7 940
2,93GHz fix/HT
DDR3-1066CL7/3Ch
232.55
205.50
61.50
Core i7 920
2,66GHz fix/HT
DDR3-1066CL7/3Ch
211.31
186.28
58.24
Core 2 QX9770
3,20GHz fix/no HT
DDR3-1333CL8/2Ch
270.51
85.60
48.42
Core 2 QX6800
2,93GHz fix/no HT
DDR3-1066CL7/2Ch
247.56
77.80
40.40

Während der Penryn etwas mehr Bandbreite beim Zugriff auf den L1-Cache erzielt, ist der Datendurchsatz des L2-Cache beim Nehalem 2,6-mal so hoch. Dabei darf man natürlich nicht vergessen, dass dem Nehalem deutlich weniger L2-Cache zur Verfügung steht. Der Datentransfer Cache-Speicher fällt beim Core i7 Extreme 965 ein Drittel höher aus als beim Core 2 Extreme QX9770.




Intel Core i7 Extreme 965, 940 und 920 im Test (Bloomfield) - Druckansicht - Seite 14 von 39

Cinebench 10 64-Bit: Rendering
Mit dem Benchmark Cinebench 10 kann man die Leistung des PC im Zusammenspiel mit der professionellen 3D-Software Cinema4D testen. Wir verwenden die 64-Bit Variante dieser Software und messen die Rendering-Performance.

Taktung und Architektur
Um die Leistungsmessungen etwas übersichtlicher aufzubreiten, haben wir sie in unterschiedliche Schwerpunkte gegliedert. Im ersten Diagramm stehen die verschiedenen Architekturen und Taktraten im Vordergrund. Um eine bessere Vergleichbarkeit zu gewährleisten, haben wir den Turbo Modus in allen Durchläufen des Core i7 deaktiviert.

Cinebench 10 64-Bit Rendering: X Threads; 1 Thread in CB
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
18425
4266
Core i7 940
2,93GHz fix/HT
DDR3-1066CL7/3Ch
16816
3884
Core i7 920
2,66GHz fix/HT
DDR3-1066CL7/3Ch
15466
3565
Core 2 QX9770
3,20GHz fix/no HT
DDR3-1333CL8/2Ch
14160
3943
Core 2 QX6800
2,93GHz fix/no HT
DDR3-1066CL7/2Ch
11755
3376

Erstaunlich, auch beim Rendering setzt sich die perfekte Skalierung des Core i7 fort: Nehmen wir die Leistung des Core i7 Extreme 965 als 100 Prozent, so kommt der Core i7 940 auf gut 91 und der Core i7 920 auf gut 83 Prozent dieser Leistung.

Ausgehend von dem Ergebnis des Core 2 Extreme QX9770 bringt der Core i7 Extreme 965 einen Leistungszuwachs um 30 Prozent, der Penryn kann im Multi-Thread-Duchlauf nicht einmal den Core i7 920 bezwingen. Doch der Core i7 zieht seine Leistung nicht nur aus dem Hyperthreading, denn bei unserer Messung mit einem einzelnen Thread liegt der Core 2 Extreme QX9770 nur knapp vor dem Core i7 940, welcher immerhin 266 MHz langsamer taktet.

Turbo Modus
Der Turbo Modus hebt bei Core i7 Prozessoren den Takt der Kerne um maximal eine Stufe bzw. 133,33 MHz an. Wird nur ein Kern belastet, sind auch zwei Stufen bzw. 266,66 MHz möglich. Für den Core i7 920 bedeutet dies eine theoretische Leistungssteigerung um 5 bis 10 Prozent, für höher getaktete Modelle fällt der prozentuale Zuwachs entsprechend geringer aus. Beim Spitzenmodell Core i7 Extreme 965 wären es lediglich 4,17 bis 8,33 Prozent, weshalb wir dort manuell eine Steigerung um drei Stufen bzw. 400 MHz (12,5 Prozent) freigegeben haben. Diese manuelle Anhebung ist nur bei der Extreme-Version möglich.

Cinebench 10 64-Bit Rendering: X Threads; 1 Thread in CB
Core i7 965
3,20GHz dyn/HT
DDR3-1066CL7/3Ch
19997
4821
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
18425
4266
Core i7 940
2,93GHz dyn/HT
DDR3-1066CL7/3Ch
17695
4130
Core i7 940
2,93GHz fix/HT
DDR3-1066CL7/3Ch
16816
3884
Core i7 920
2,66GHz dyn/HT
DDR3-1066CL7/3Ch
16106
3843
Core i7 920
2,66GHz fix/HT
DDR3-1066CL7/3Ch
15466
3565

Im Multithread-Durchlauf erzielt der Core i7 Extreme 965 dank Turbo Modus eine Steigerung um 8,5 Prozent. Wird nur ein Thread verwendet, sind es sogar 13 Prozent. Der Core i7 940 legt mit acht Threads um 5,2 Prozent und mit einem Thread um 6,33 Prozent zu, beim Core i7 920 sind es 4,1 bzw. 7,8 Prozent. Die deutlichere Steigerung bei Verwendung eines Threads liegt daran, dass der Turbo Modus den Takt in diesem Fall um zwei Stufen anhebt.

Hyperthreading
Der dritte Schwerpunkt ist Hyperthreading, denn während diese Funktion für Anwendungen, welche mehr als vier Kerne nutzen können, ein Segen ist, kommen einige Programme, welche weniger Kerne auslasten, zuweilen ins Straucheln.

Cinebench 10 64-Bit Rendering: X Threads; 1 Thread in CB
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
18425
4266
Core i7 965
3,20GHz fix/no HT
DDR3-1066CL7/3Ch
16004
4300
Core 2 QX9770
3,20GHz fix/no HT
DDR3-1333CL8/2Ch
14160
3943

Das Abschalten des Hyperthreading wirkt sich natürlich nur dann aus, wenn von der Software auch mehrere Kerne angesprochen werden. Cinebench 10 64-Bit gehört zu den wenigen Programmen, die mehr als vier Threads verwenden. Ohne Hyperthreading fällt das Ergebnis um 13 Prozent. Ausgehend vom Resultat des Core 2 Extreme QX9770 ist der Core i7 Extreme 965 auch ohne Hyperthreading noch 9 bis 13 Prozent performanter.

Speicherbandbreite
Auch die Speicherbandbreite kann einen Einfluss auf die Leistungsmessungen haben. Intels Core i7 unterstützt maximal drei Speicherkanäle, welche wir jeweils mit 1 GByte DDR3-1066 CL7-7-7-21 Modulen von Qimonda bestückt haben. Für die Durchläufe mit zwei und einem Speicherkanal kommen je zwei dieser Speicherriegel zum Einsatz. Hinzu kommt eine 3-Kanal-Messung, bei der wir den Speicher auf DDR3-1333 CL8-8-8-24 übertaktet haben.

Cinebench 10 64-Bit Rendering: X Threads; 1 Thread in CB
Core i7 965
3,20GHz fix/HT
DDR3-1333CL8/3Ch
18377
4248
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
18425
4266
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/2Ch
18334
4166
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/1Ch
18305
4178

Auf die Mehrkern-Messung hat die Speicherbandbreite nur einen minimalen Einfluss, die Werte geben um 0,5 bis 0,65 Porzent nach. Etwas deutlicher sind die Auswirkungen, wenn nur ein Kern genutzt wird. Doch auch hier halten sich die Einbrüche mit 2,0 bis 2,4 Prozent in Grenzen. Die Übertaktung des Speichers bringt allerdings keine weiteren Vorteile.




Intel Core i7 Extreme 965, 940 und 920 im Test (Bloomfield) - Druckansicht - Seite 15 von 39

POV-Ray 3.70 Beta 29 64-Bit: Raytracing
Bei POV-Ray handelt es sich um einen kostenlosen Raytracer, welcher ein offizielles Benchmark-Script beinhaltet. Wir verwenden die 64-Bit Variante der Software und testen mit einem sowie der maximalen Anzahl an Threads.

Taktung und Architektur
Um die Leistungsmessungen etwas übersichtlicher aufzubreiten, haben wir sie in unterschiedliche Schwerpunkte gegliedert. Im ersten Diagramm stehen die verschiedenen Architekturen und Taktraten im Vordergrund. Um eine bessere Vergleichbarkeit zu gewährleisten, haben wir den Turbo Modus in allen Durchläufen des Core i7 deaktiviert.

POV-Ray 3.70 Beta 29 64-Bit: X Threads; 1 Thread in PPS
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
4017
783
Core i7 940
2,93GHz fix/HT
DDR3-1066CL7/3Ch
3681
717
Core i7 920
2,66GHz fix/HT
DDR3-1066CL7/3Ch
3352
650
Core 2 QX9770
3,20GHz fix/no HT
DDR3-1333CL8/2Ch
2696
681
Core 2 QX6800
2,93GHz fix/no HT
DDR3-1066CL7/2Ch
2423
611

Und auch beim Raytracing sehen wir eine perfekte Skalierung: Kommt der Core i7 Extreme 965 auf 100 Prozent, dann erreicht der Core i7 940 abermals gut 91 Prozent und der Core i7 920 über 83 Prozent.
Besonders deutlich reagiert POV-Ray auf die Vorzüge des Hyperthreading: Nehmen wir wieder das Resultat des Core 2 Extreme QX9770 als 100 Prozent, so erzielt der Core i7 Extreme 965 eine Mehrleistung von sage und schreibe 49 Prozent. Abermals muss sich der Penryn dem Core i7 920 geschlagen geben und kann diesen nur im Single-Thread-Durchlauf überholen.

Turbo Modus
Der Turbo Modus hebt bei Core i7 Prozessoren den Takt der Kerne um maximal eine Stufe bzw. 133,33 MHz an. Wird nur ein Kern belastet, sind auch zwei Stufen bzw. 266,66 MHz möglich. Für den Core i7 920 bedeutet dies eine theoretische Leistungssteigerung um 5 bis 10 Prozent, für höher getaktete Modelle fällt der prozentuale Zuwachs entsprechend geringer aus. Beim Spitzenmodell Core i7 Extreme 965 wären es lediglich 4,17 bis 8,33 Prozent, weshalb wir dort manuell eine Steigerung um drei Stufen bzw. 400 MHz (12,5 Prozent) freigegeben haben. Diese manuelle Anhebung ist nur bei der Extreme-Version möglich.

POV-Ray 3.70 Beta 29 64-Bit: X Threads; 1 Thread in PPS
Core i7 965
3,20GHz dyn/HT
DDR3-1066CL7/3Ch
4394
882
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
4017
783
Core i7 940
2,93GHz dyn/HT
DDR3-1066CL7/3Ch
3851
778
Core i7 940
2,93GHz fix/HT
DDR3-1066CL7/3Ch
3681
717
Core i7 920
2,66GHz dyn/HT
DDR3-1066CL7/3Ch
3540
719
Core i7 920
2,66GHz fix/HT
DDR3-1066CL7/3Ch
3352
650

Der Turbo Modus bringt dem Core i7 Extreme 965 im Mehrkern-Durchlauf eine Steigerung um gut 12 Prozent, bei Verwendung eines Kernes sind es zumindest noch 9 Prozent. Mit einem Thread beschleunigt der Tubro den Core i7 940 um 8,5 Prozent und den Core i7 920 um 10,6 Prozent, da in diesem Fall um zwei Stufen hochgetaktet wird. Lasten wir alle Kerne aus, sehen wir lediglich Zugewinne um 4,6 bzw. 5,6 Prozent, da dann nur eine Taktstufe hinzukommt.

Hyperthreading
Der dritte Schwerpunkt ist Hyperthreading, denn während diese Funktion für Anwendungen, welche mehr als vier Kerne nutzen können, ein Segen ist, kommen einige Programme, welche weniger Kerne auslasten, zuweilen ins Straucheln.

POV-Ray 3.70 Beta 29 64-Bit: X Threads; 1 Thread in PPS
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
4017
783
Core i7 965
3,20GHz fix/no HT
DDR3-1066CL7/3Ch
3113
787
Core 2 QX9770
3,20GHz fix/no HT
DDR3-1333CL8/2Ch
2696
681

Ohne Hyperthreading bricht das Ergebnis des Core i7 Extreme 965 um 22,5 Prozent ein. POV-Ray reagiert somit viel deutlicher als Cinebench 10 auf die Reduzierung der Threads von acht auf vier. Wird nur ein Kern genutzt messen wir einen minimalen Leistungsanstieg. Dennoch ist die Nehalem-Architektur auch ohne Hyperthreading ihrem Vorgänger überlegen, ausgehend vom Core 2 Extreme QX9770 verzeichnen wir eine Mehrleistung von 15 Prozent.

Speicherbandbreite
Auch die Speicherbandbreite kann einen Einfluss auf die Leistungsmessungen haben. Intels Core i7 unterstützt maximal drei Speicherkanäle, welche wir jeweils mit 1 GByte DDR3-1066 CL7-7-7-21 Modulen von Qimonda bestückt haben. Für die Durchläufe mit zwei und einem Speicherkanal kommen je zwei dieser Speicherriegel zum Einsatz. Hinzu kommt eine 3-Kanal-Messung, bei der wir den Speicher auf DDR3-1333 CL8-8-8-24 übertaktet haben.

POV-Ray 3.70 Beta 29 64-Bit: X Threads; 1 Thread in PPS
Core i7 965
3,20GHz fix/HT
DDR3-1333CL8/3Ch
4026
784
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
4017
783
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/2Ch
4033
786
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/1Ch
4012
784

Auf die Ergebnisse von POV-Ray hat die Speicherbandbreite so gut wie keinen Einfluss. Lediglich im Mehrkern-Durchlauf sehen wir eine geringe Abstufung, welche allerdings weder prozentual noch im realen Betrieb ins Gewicht fällt. Die Bestwerte zeigen sich zudem nicht im Triple- sondern im Dual-Channel-Betrieb.




Intel Core i7 Extreme 965, 940 und 920 im Test (Bloomfield) - Druckansicht - Seite 16 von 39

7-Zip 4.60 Beta: Benchmark
Der Packer 7-Zip enthält ein Benchmark-Tool, welches die Leistung beim Komprimieren und Dekomprimieren von Daten ermittelt. Im Gegensatz zum Programm selbst, welches maximal zwei Kerne auslastet, kann das Tool auch mit acht Threads umgehen.

Taktung und Architektur
Um die Leistungsmessungen etwas übersichtlicher aufzubreiten, haben wir sie in unterschiedliche Schwerpunkte gegliedert. Im ersten Diagramm stehen die verschiedenen Architekturen und Taktraten im Vordergrund. Um eine bessere Vergleichbarkeit zu gewährleisten, haben wir den Turbo Modus in allen Durchläufen des Core i7 deaktiviert.

7-Zip 4.60 Beta Benchmark: 8/4, 2 und 1 Threads in MIPS
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
17866
6396
3418
Core i7 940
2,93GHz fix/HT
DDR3-1066CL7/3Ch
16503
5905
3193
Core i7 920
2,66GHz fix/HT
DDR3-1066CL7/3Ch
15223
5363
2914
Core 2 QX9770
3,20GHz fix/no HT
DDR3-1333CL8/2Ch
11658
6359
3260
Core 2 QX6800
2,93GHz fix/no HT
DDR3-1066CL7/2Ch
10303
5792
2937

Zumindest im Benchmark-Tool von 7-Zip skaliert der Core i7 wieder einmal sehr gut. Der Core i7 920 erzielt gut 84 Prozent der Leistung des Core i7 Extreme 965, der Core i7 940 bringt es auf mehr als 92 Prozent. Diese Abstände entsprechen in etwa den Taktunterschieden dieser drei Prozessoren.
Diese Leistungsmessung reagiert sogar noch stärker als POV-Ray auf das Hyperthreading: Ausgehend vom Core 2 Extreme QX9770 markiert der Core i7 Extreme 965 einen Leistungszuwachs um 53 Prozent. Werden nur ein oder zwei Threads verwendet, kann der Penryn allerdings mit dem Nehalem mithalten.

Turbo Modus
Der Turbo Modus hebt bei Core i7 Prozessoren den Takt der Kerne um maximal eine Stufe bzw. 133,33 MHz an. Wird nur ein Kern belastet, sind auch zwei Stufen bzw. 266,66 MHz möglich. Für den Core i7 920 bedeutet dies eine theoretische Leistungssteigerung um 5 bis 10 Prozent, für höher getaktete Modelle fällt der prozentuale Zuwachs entsprechend geringer aus. Beim Spitzenmodell Core i7 Extreme 965 wären es lediglich 4,17 bis 8,33 Prozent, weshalb wir dort manuell eine Steigerung um drei Stufen bzw. 400 MHz (12,5 Prozent) freigegeben haben. Diese manuelle Anhebung ist nur bei der Extreme-Version möglich.

7-Zip 4.60 Beta Benchmark: 8/4, 2 und 1 Threads in MIPS
Core i7 965
3,20GHz dyn/HT
DDR3-1066CL7/3Ch
19738
7184
3796
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
17866
6396
3418
Core i7 940
2,93GHz dyn/HT
DDR3-1066CL7/3Ch
17254
6157
3422
Core i7 940
2,93GHz fix/HT
DDR3-1066CL7/3Ch
16503
5905
3193
Core i7 920
2,66GHz dyn/HT
DDR3-1066CL7/3Ch
15904
5707
3201
Core i7 920
2,66GHz fix/HT
DDR3-1066CL7/3Ch
15223
5363
2914

Der Turbo Modus bringt dem Core i7 Extreme 965 wieder einmal zwischen 10 und 12 Prozent Mehrleistung. Wird nur ein Thread verwendet, bringt der Tubro den Core i7 920 auf das Niveau des Core i7 940 und den Core i7 640 auf das Niveau des Core i7 Extreme 965. Kommen mehrere Threads zum Einsatz, verkürzt sich die Bearbeitungszeit allerdings nur um 4,4 bzw. 5,4 Prozent.

Hyperthreading
Der dritte Schwerpunkt ist Hyperthreading, denn während diese Funktion für Anwendungen, welche mehr als vier Kerne nutzen können, ein Segen ist, kommen einige Programme, welche weniger Kerne auslasten, zuweilen ins Straucheln.

7-Zip 4.60 Beta Benchmark: 8, 2 und 1 Threads in MIPS
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
17866
6396
3418
Core i7 965
3,20GHz fix/no HT
DDR3-1066CL7/3Ch
12875
6421
3425
Core 2 QX9770
3,20GHz fix/no HT
DDR3-1333CL8/2Ch
11658
6359
3260

Die Deaktivierung von Hyperthreading wirkt sich natürlich nur im Durchlauf mit acht Threads aus, hier bricht die Leistung um 28 Prozent ein. Werden nur ein oder zwei Threads verwendet, sehen wir leicht bessere Ergebnisse. Bei der Verwendung von acht Threads erreicht der Core i7 Extreme 965 auch ohne Hyperthreading eine Mehrleistung von 10 Prozent im Vergleich zum Core 2 Extreme QX9770.

Speicherbandbreite
Auch die Speicherbandbreite kann einen Einfluss auf die Leistungsmessungen haben. Intels Core i7 unterstützt maximal drei Speicherkanäle, welche wir jeweils mit 1 GByte DDR3-1066 CL7-7-7-21 Modulen von Qimonda bestückt haben. Für die Durchläufe mit zwei und einem Speicherkanal kommen je zwei dieser Speicherriegel zum Einsatz. Hinzu kommt eine 3-Kanal-Messung, bei der wir den Speicher auf DDR3-1333 CL8-8-8-24 übertaktet haben.

7-Zip 4.60 Beta Benchmark: 8, 2 und 1 Threads in MIPS
Core i7 965
3,20GHz fix/HT
DDR3-1333CL8/3Ch
17987
6426
3446
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
17866
6396
3418
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/2Ch
17196
6339
3411
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/1Ch
16384
6328
3396

Verwendet der Core i7 nur einen Speicherkanal, bricht die 8-Thread-Messung um 8,3 Prozent ein. Messen wir im Dual-Channel-Betrieb, sind es immerhin noch 3,75 Prozent. Die Durchläufe mit ein oder zwei Threads reagieren hingegen kaum. Die Übertaktung des Speichers auf DDR3-1333 CL8 macht sich so gut wie nicht bezahlt, die Resultate legen lediglich um 0,5 bis 0,8 Prozent zu.




Intel Core i7 Extreme 965, 940 und 920 im Test (Bloomfield) - Druckansicht - Seite 17 von 39

7-Zip 4.60 Beta: Packen
Nach der Theorie kommen wir nun zur Praxis und packen mit 7-Zip die 587 MByte große SPECViewPerf10-Suite. Da 7-Zip beim Packen maximal zwei Kerne verwendet, machen wir einen Durchlauf mit einem und einen zweiten mit zwei Threads.

Taktung und Architektur
Um die Leistungsmessungen etwas übersichtlicher aufzubreiten, haben wir sie in unterschiedliche Schwerpunkte gegliedert. Im ersten Diagramm stehen die verschiedenen Architekturen und Taktraten im Vordergrund. Um eine bessere Vergleichbarkeit zu gewährleisten, haben wir den Turbo Modus in allen Durchläufen des Core i7 deaktiviert.

7-Zip 4.60 Beta Packen: 2 Threads; 1 Thread in s - geringere Werte sind besser
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
101
221
Core i7 940
2,93GHz fix/HT
DDR3-1066CL7/3Ch
105
231
Core i7 920
2,66GHz fix/HT
DDR3-1066CL7/3Ch
115
243
Core 2 QX9770
3,20GHz fix/no HT
DDR3-1333CL8/2Ch
116
243
Core 2 QX6800
2,93GHz fix/no HT
DDR3-1066CL7/2Ch
142
288

In der Praxis wirken sich die niedrigeren Taktraten des Core i7 940 und 920 bei 7-Zip etwas geringer aus als im Benchmark. So verliert der Core i7 940 lediglich 4,0 bis 4,5 Prozent auf den Core i7 Extreme 965, beim Core i7 920 sind es zwischen 10 und 14 Prozent.
Ausgehend vom Core 2 Extreme QX9770 bewältigt der Core i7 Extreme 965 die Kompression gut 12 Prozent schneller. Damit liegt der mit 3,2 GHz getaktete Penryn exakt auf dem Leistungsniveau des lediglich 2,66 GHz schnellen Core i7 920.

Turbo Modus
Der Turbo Modus hebt bei Core i7 Prozessoren den Takt der Kerne um maximal eine Stufe bzw. 133,33 MHz an. Wird nur ein Kern belastet, sind auch zwei Stufen bzw. 266,66 MHz möglich. Für den Core i7 920 bedeutet dies eine theoretische Leistungssteigerung um 5 bis 10 Prozent, für höher getaktete Modelle fällt der prozentuale Zuwachs entsprechend geringer aus. Beim Spitzenmodell Core i7 Extreme 965 wären es lediglich 4,17 bis 8,33 Prozent, weshalb wir dort manuell eine Steigerung um drei Stufen bzw. 400 MHz (12,5 Prozent) freigegeben haben. Diese manuelle Anhebung ist nur bei der Extreme-Version möglich.

7-Zip 4.60 Beta Packen: 2 Threads; 1 Thread in s - geringere Werte sind besser
Core i7 965
3,20GHz dyn/HT
DDR3-1066CL7/3Ch
97
210
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
101
221
Core i7 940
2,93GHz dyn/HT
DDR3-1066CL7/3Ch
102
220
Core i7 940
2,93GHz fix/HT
DDR3-1066CL7/3Ch
105
231
Core i7 920
2,66GHz dyn/HT
DDR3-1066CL7/3Ch
108
231
Core i7 920
2,66GHz fix/HT
DDR3-1066CL7/3Ch
115
243

Der Turbo Modus bringt dem Core i7 Extreme 965 diesmal nur eine Leistungssteigerung um magere 4 bis 5 Prozent. Core i7 940 und 920 klettern bei der Single-Thread-Messung um je eine Leistungsstufe nach oben und selbst bei Verwendung von zwei Kernen kommt der Core i7 940 beinahe auf das Niveau des Core i7 Extreme 965.

Hyperthreading
Der dritte Schwerpunkt ist Hyperthreading, denn während diese Funktion für Anwendungen, welche mehr als vier Kerne nutzen können, ein Segen ist, kommen einige Programme, welche weniger Kerne auslasten, zuweilen ins Straucheln.

7-Zip 4.60 Beta Packen: 2 Threads; 1 Thread in s - geringere Werte sind besser
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
101
221
Core i7 965
3,20GHz fix/no HT
DDR3-1066CL7/3Ch
99
220
Core 2 QX9770
3,20GHz fix/no HT
DDR3-1333CL8/2Ch
116
243

Hyperthreading scheint für den Packer 7-Zip eher hinderlich zu sein, ohne dieses Feature veringert sich die Bearbeitungszeit um 0,5 bis 2,0 Prozent. Verwunderlich ist das nicht, denn es werden von diesem Programm ja nur zwei Threads verwendet. Damit steigt auch der Vorsprung auf den Core 2 Extreme QX9770 nochmals leicht an.

Speicherbandbreite
Auch die Speicherbandbreite kann einen Einfluss auf die Leistungsmessungen haben. Intels Core i7 unterstützt maximal drei Speicherkanäle, welche wir jeweils mit 1 GByte DDR3-1066 CL7-7-7-21 Modulen von Qimonda bestückt haben. Für die Durchläufe mit zwei und einem Speicherkanal kommen je zwei dieser Speicherriegel zum Einsatz. Hinzu kommt eine 3-Kanal-Messung, bei der wir den Speicher auf DDR3-1333 CL8-8-8-24 übertaktet haben.

7-Zip 4.60 Beta Packen: 2 Threads; 1 Thread in s - geringere Werte sind besser
Core i7 965
3,20GHz fix/HT
DDR3-1333CL8/3Ch
97
213
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
101
221
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/2Ch
103
223
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/1Ch
109
228

7-Zip reagiert normalerweise sehr deutlich auf die Speicherbandbreite, doch die Messungen im 3-Kanal-Betrieb sind eher enttäuschend: Die Bearbeitungszeit verkürzt sich um lediglich 1 bis 2 Prozent. Eine deutlichere Stufe ergibt sich zur Messung mit einem einzelnen Speicherkanal. Verwenden wir einen Thread, benögt der Packer gut 3 Prozent länger, bei zwei Threads sind es sogar knapp 8 Prozent. Die Erhöhung des Speichertaktes auf DDR3-1333 CL8 verkürzt den Vorgang um knapp 4 Prozent.




Intel Core i7 Extreme 965, 940 und 920 im Test (Bloomfield) - Druckansicht - Seite 18 von 39

WinRAR 3.80: Packen
Ein zweiter, weit verbreiteter Packer, welcher mehr als einen Prozessorkern auslasten kann, ist WinRAR. WinRAR geht hierbei sogar noch einen Schritt weiter als 7-Zip, denn es kann seine Arbeit auf 8 Threads verteilen. Abermals packen wir die 587 MByte große SPECViewPerf10-Suite und stoppen die Zeit.

Taktung und Architektur
Um die Leistungsmessungen etwas übersichtlicher aufzubreiten, haben wir sie in unterschiedliche Schwerpunkte gegliedert. Im ersten Diagramm stehen die verschiedenen Architekturen und Taktraten im Vordergrund. Um eine bessere Vergleichbarkeit zu gewährleisten, haben wir den Turbo Modus in allen Durchläufen des Core i7 deaktiviert.

WinRAR 3.80 Packen: X Threads; 1 Thread in s - geringere Werte sind besser
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
133
272
Core i7 940
2,93GHz fix/HT
DDR3-1066CL7/3Ch
140
283
Core i7 920
2,66GHz fix/HT
DDR3-1066CL7/3Ch
147
295
Core 2 QX9770
3,20GHz fix/no HT
DDR3-1333CL8/2Ch
196
318
Core 2 QX6800
2,93GHz fix/no HT
DDR3-1066CL7/2Ch
246
387

Im Vergleich zum Core i7 Extreme 965 benötigt der Core i7 940 im Multithreaded-Betrieb gut 5 Prozent mehr Zeit, beim Core i7 920 steigt die Packzeit um 10,5 Prozent an.
Es zahlt sich aus, dass WinRAR mit mehr als vier Threads umgehen kann. Nehmen wir das Ergebnis des Core 2 Extreme QX9770 als 100 Prozent, so verkürzt sich die Packzeit mit dem Core i7 Extreme 965 um fast ein Drittel. Und selbst der Core i7 920 erledigt diese Aufgabe in 25 Prozent weniger Zeit.

Turbo Modus
Der Turbo Modus hebt bei Core i7 Prozessoren den Takt der Kerne um maximal eine Stufe bzw. 133,33 MHz an. Wird nur ein Kern belastet, sind auch zwei Stufen bzw. 266,66 MHz möglich. Für den Core i7 920 bedeutet dies eine theoretische Leistungssteigerung um 5 bis 10 Prozent, für höher getaktete Modelle fällt der prozentuale Zuwachs entsprechend geringer aus. Beim Spitzenmodell Core i7 Extreme 965 wären es lediglich 4,17 bis 8,33 Prozent, weshalb wir dort manuell eine Steigerung um drei Stufen bzw. 400 MHz (12,5 Prozent) freigegeben haben. Diese manuelle Anhebung ist nur bei der Extreme-Version möglich.

WinRAR 3.80 Packen: X Threads; 1 Thread in s - geringere Werte sind besser
Core i7 965
3,20GHz dyn/HT
DDR3-1066CL7/3Ch
126
259
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
133
272
Core i7 940
2,93GHz dyn/HT
DDR3-1066CL7/3Ch
136
268
Core i7 940
2,93GHz fix/HT
DDR3-1066CL7/3Ch
140
283
Core i7 920
2,66GHz dyn/HT
DDR3-1066CL7/3Ch
140
279
Core i7 920
2,66GHz fix/HT
DDR3-1066CL7/3Ch
147
295

Der Tubro Modus bringt uns beim Core i7 Extreme 965 eine Zeitersparnis von gut 5 Prozent, wird nur ein Thread verwendet, fallen die Unterschiede etwas geringer aus. Core i7 940 und 920 legen bei der Verwendung eines einzelnen Threads so stark zu, dass sie sogar die nächst höhere Prozessorstufe überholen. Möglicherweise liegt dies an geringeren Latenzen, welche bei der Hochtaktung der langsameren CPUs nicht angepasst werden.

Hyperthreading
Der dritte Schwerpunkt ist Hyperthreading, denn während diese Funktion für Anwendungen, welche mehr als vier Kerne nutzen können, ein Segen ist, kommen einige Programme, welche weniger Kerne auslasten, zuweilen ins Straucheln.

WinRAR 3.80 Packen: X Threads; 1 Thread in s - geringere Werte sind besser
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
133
272
Core i7 965
3,20GHz fix/no HT
DDR3-1066CL7/3Ch
152
271
Core 2 QX9770
3,20GHz fix/no HT
DDR3-1333CL8/2Ch
196
318

Da WinRAR mit acht Threads arbeiten kann, profitiert dieser Packer von Hyperthreading und verkürzt die Rechenzeit um mehr als 14 Prozent. Verwenden wir nur einen Thread, wird Hyperthreading zum Ballast und WinRAR minimal ausgebremst. Erstaunlich, dass der Core i7 Extreme 965 auch ohne Hyperthreading noch 22,5 Prozent weniger Zeit benötigt als der Core 2 Extreme QX9770.

Speicherbandbreite
Auch die Speicherbandbreite kann einen Einfluss auf die Leistungsmessungen haben. Intels Core i7 unterstützt maximal drei Speicherkanäle, welche wir jeweils mit 1 GByte DDR3-1066 CL7-7-7-21 Modulen von Qimonda bestückt haben. Für die Durchläufe mit zwei und einem Speicherkanal kommen je zwei dieser Speicherriegel zum Einsatz. Hinzu kommt eine 3-Kanal-Messung, bei der wir den Speicher auf DDR3-1333 CL8-8-8-24 übertaktet haben.

WinRAR 3.80 Packen: X Threads; 1 Thread in s - geringere Werte sind besser
Core i7 965
3,20GHz fix/HT
DDR3-1333CL8/3Ch
130
261
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
133
272
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/2Ch
137
275
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/1Ch
155
281

Obwohl WinRAR etwas deutlicher als 7-Zip auf die Speicherbandbreite reagiert, sind die Ergbenisse der 3-Kanal-Messung dennoch ernüchternd. Der Vorteil gegenüber dem Dual-Channel-Betrieb liegt bei mageren 3 Prozent, der Abstand zum Single-Channel-Ergebnis liegt bei immerhin 16,5 Prozent. Die Messungen mit einem Thread reagieren kaum auf die Speicherbandbreite, hier liegen die Einbrüche bei 1 bis 3 Prozent. DDR3-1333 CL8 wirkt sich mit einer Verkürzung der Bearbeitungszeit um 4 Prozent aus.




Intel Core i7 Extreme 965, 940 und 920 im Test (Bloomfield) - Druckansicht - Seite 19 von 39

WinAce 2.69: Packen
Als dritte und letzte Kompressionssoftware sehen wir uns WinAce in der Version 2.69 an. Während WinRAR die Berechnung auf acht Threads verteilen kann und 7-Zip zumindest zwei Threads verwendet, ist WinAce nur singlethreaded programmiert. Packen wir also ein letztes Mal die 587 MByte große SPECViewPerf10-Suite.

Taktung und Architektur
Um die Leistungsmessungen etwas übersichtlicher aufzubreiten, haben wir sie in unterschiedliche Schwerpunkte gegliedert. Im ersten Diagramm stehen die verschiedenen Architekturen und Taktraten im Vordergrund. Um eine bessere Vergleichbarkeit zu gewährleisten, haben wir den Turbo Modus in allen Durchläufen des Core i7 deaktiviert.

WinAce 2.69 Packen: 1 Thread in s - geringere Werte sind besser
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
204
Core i7 940
2,93GHz fix/HT
DDR3-1066CL7/3Ch
216
Core i7 920
2,66GHz fix/HT
DDR3-1066CL7/3Ch
232
Core 2 QX9770
3,20GHz fix/no HT
DDR3-1333CL8/2Ch
247
Core 2 QX6800
2,93GHz fix/no HT
DDR3-1066CL7/2Ch
304

WinAce reagiert wieder ein wenig deutlicher auf die Taktrate, so dass der Core i7 940 knapp 6 Prozent und der Core i7 920 knapp 14 Prozent länger benötigt als der Core i7 Extreme 965. Insgesamt skaliert der Core i7 mit diesem Packer am besten.
Da WinAce nur einen Thread verwendet, hatten wir hier ein besseres Abschneiden des Core 2 Extreme QX9770 erwartet. Doch der Core i7 Extreme 965 erledigt diese Aufgabe 17,5 Prozent schneller und auch der Core i7 920 braucht 6 Prozent weniger Zeit.

Turbo Modus
Der Turbo Modus hebt bei Core i7 Prozessoren den Takt der Kerne um maximal eine Stufe bzw. 133,33 MHz an. Wird nur ein Kern belastet, sind auch zwei Stufen bzw. 266,66 MHz möglich. Für den Core i7 920 bedeutet dies eine theoretische Leistungssteigerung um 5 bis 10 Prozent, für höher getaktete Modelle fällt der prozentuale Zuwachs entsprechend geringer aus. Beim Spitzenmodell Core i7 Extreme 965 wären es lediglich 4,17 bis 8,33 Prozent, weshalb wir dort manuell eine Steigerung um drei Stufen bzw. 400 MHz (12,5 Prozent) freigegeben haben. Diese manuelle Anhebung ist nur bei der Extreme-Version möglich.

WinAce 2.69 Packen: 1 Thread in s - geringere Werte sind besser
Core i7 965
3,20GHz dyn/HT
DDR3-1066CL7/3Ch
189
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
204
Core i7 940
2,93GHz dyn/HT
DDR3-1066CL7/3Ch
210
Core i7 940
2,93GHz fix/HT
DDR3-1066CL7/3Ch
216
Core i7 920
2,66GHz dyn/HT
DDR3-1066CL7/3Ch
223
Core i7 920
2,66GHz fix/HT
DDR3-1066CL7/3Ch
232

Verwenden wir den Tubro Modus, kann der Core i7 Extreme 965 die Bearbeitungszeit um gut 7 Prozent reduzieren. Core i7 940 und 920 zeigen mit 2,8 und 3,9 Prozent Leistungsgewinn recht bescheidene Resultate.

Hyperthreading
Der dritte Schwerpunkt ist Hyperthreading, denn während diese Funktion für Anwendungen, welche mehr als vier Kerne nutzen können, ein Segen ist, kommen einige Programme, welche weniger Kerne auslasten, zuweilen ins Straucheln.

WinAce 2.69 Packen: 1 Thread in s - geringere Werte sind besser
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
204
Core i7 965
3,20GHz fix/no HT
DDR3-1066CL7/3Ch
203
Core 2 QX9770
3,20GHz fix/no HT
DDR3-1333CL8/2Ch
247

Wenn nur ein Thread verwendet wird, sorgt HyperThreading für einen höheren Verwaltungsaufwand, bringt aber keinerlei Vorteile für die Software. Dies haben bereits einige Messungen dieser Testreihe ergeben und auch WinAce bildet hier keine Ausnahme. Somit ist auch weiterhin für den Core 2 Extreme QX9770 kein Land in Sicht.

Speicherbandbreite
Auch die Speicherbandbreite kann einen Einfluss auf die Leistungsmessungen haben. Intels Core i7 unterstützt maximal drei Speicherkanäle, welche wir jeweils mit 1 GByte DDR3-1066 CL7-7-7-21 Modulen von Qimonda bestückt haben. Für die Durchläufe mit zwei und einem Speicherkanal kommen je zwei dieser Speicherriegel zum Einsatz. Hinzu kommt eine 3-Kanal-Messung, bei der wir den Speicher auf DDR3-1333 CL8-8-8-24 übertaktet haben.

WinAce 2.69 Packen: 1 Thread in s - geringere Werte sind besser
Core i7 965
3,20GHz fix/HT
DDR3-1333CL8/3Ch
204
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
204
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/2Ch
206
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/1Ch
213

Die Speicherbandbreite interessiert WinAce kaum. Der Wechsel zur Dual-Channel-Konfiguration verlängert die Bearbeitungszeit um nicht einmal 1 Prozent und der Unterschied zwischen 1- und 3-Kanal-Betrieb liegt bei gerade einmal 4,4 Prozent. Selbst eine positive Reaktion auf DDR3-1333 CL8 bleibt aus.




Intel Core i7 Extreme 965, 940 und 920 im Test (Bloomfield) - Druckansicht - Seite 20 von 39

DivX 6.8.4: Video-Encoding
Kommen wir nun zu den Multimedia-Benchmarks. Zunächst werden wir mit DivX 6.8.4 eine 120 Sekunden lange Videosequenz von MPEG2 (720x526, 29,97 fps) nach DivX HD1080P konvertieren und stoppen die hierzu benötigte Zeit. Die Zeitmessung läuft vom Beginn der Konvertierung bis zur Fertigstellung der Menüstruktur.

Taktung und Architektur
Um die Leistungsmessungen etwas übersichtlicher aufzubreiten, haben wir sie in unterschiedliche Schwerpunkte gegliedert. Im ersten Diagramm stehen die verschiedenen Architekturen und Taktraten im Vordergrund. Um eine bessere Vergleichbarkeit zu gewährleisten, haben wir den Turbo Modus in allen Durchläufen des Core i7 deaktiviert.

DivX 6.8.4: Encoding in s - geringere Werte sind besser
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
76.89
Core i7 940
2,93GHz fix/HT
DDR3-1066CL7/3Ch
82.31
Core i7 920
2,66GHz fix/HT
DDR3-1066CL7/3Ch
90.17
Core 2 QX9770
3,20GHz fix/no HT
DDR3-1333CL8/2Ch
85.55
Core 2 QX6800
2,93GHz fix/no HT
DDR3-1066CL7/2Ch
103.78

Ausgehend vom Core i7 Extreme 965 benötigt der Core i7 940 gut 7 Prozent und der Core i7 920 ca. 17 Prozent länger. Diese Abstände spiegeln abermals sehr gut die Taktunterschiede zwischen den Prozessoren wieder, der Core i7 skaliert folglich wieder einmal sehr gut.
Nehmen wir den Core 2 Extreme QX9770 als Ausgangspunkt, stellt der Wechsel zum gleich hoch getakteten Nehalem eine Leistungssteigerung um 10 Prozent dar. Dies deutet bereits an, dass DivX die Möglichkeiten von Hyperthreading nicht ausschöpfen kann.

Turbo Modus
Der Turbo Modus hebt bei Core i7 Prozessoren den Takt der Kerne um maximal eine Stufe bzw. 133,33 MHz an. Wird nur ein Kern belastet, sind auch zwei Stufen bzw. 266,66 MHz möglich. Für den Core i7 920 bedeutet dies eine theoretische Leistungssteigerung um 5 bis 10 Prozent, für höher getaktete Modelle fällt der prozentuale Zuwachs entsprechend geringer aus. Beim Spitzenmodell Core i7 Extreme 965 wären es lediglich 4,17 bis 8,33 Prozent, weshalb wir dort manuell eine Steigerung um drei Stufen bzw. 400 MHz (12,5 Prozent) freigegeben haben. Diese manuelle Anhebung ist nur bei der Extreme-Version möglich.

DivX 6.8.4: Encoding in s - geringere Werte sind besser
Core i7 965
3,20GHz dyn/HT
DDR3-1066CL7/3Ch
69.69
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
76.89
Core i7 940
2,93GHz dyn/HT
DDR3-1066CL7/3Ch
79.09
Core i7 940
2,93GHz fix/HT
DDR3-1066CL7/3Ch
82.31
Core i7 920
2,66GHz dyn/HT
DDR3-1066CL7/3Ch
85.44
Core i7 920
2,66GHz fix/HT
DDR3-1066CL7/3Ch
90.17

Der Turbo Modus verkürzt die Bearbeitungszeit des Core i7 Extreme 965 um gut 9 Prozent. Da Core i7 940 und 920 lediglich 133,33 MHz Taktrate hinzugewinnen, steigert sich ihre Leistung um lediglich 3,8 bzw. 5,25 Prozent.

Hyperthreading
Der dritte Schwerpunkt ist Hyperthreading, denn während diese Funktion für Anwendungen, welche mehr als vier Kerne nutzen können, ein Segen ist, kommen einige Programme, welche weniger Kerne auslasten, zuweilen ins Straucheln.

DivX 6.8.4: Encoding in s - geringere Werte sind besser
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
76.89
Core i7 965
3,20GHz fix/no HT
DDR3-1066CL7/3Ch
73.99
Core 2 QX9770
3,20GHz fix/no HT
DDR3-1333CL8/2Ch
85.55

Der Vergleich mit und ohne Hyperthreading belegt, dass diese Technologie DivX um knapp 4 Prozent ausbremst, statt für zusätzliche Leistung zu sorgen. Um Hyperthreading bereinigt, braucht das Top-Modell der Nehalem-Architektur 13,5 Prozent weniger Zeit als der schnellste Penryn.

Speicherbandbreite
Auch die Speicherbandbreite kann einen Einfluss auf die Leistungsmessungen haben. Intels Core i7 unterstützt maximal drei Speicherkanäle, welche wir jeweils mit 1 GByte DDR3-1066 CL7-7-7-21 Modulen von Qimonda bestückt haben. Für die Durchläufe mit zwei und einem Speicherkanal kommen je zwei dieser Speicherriegel zum Einsatz. Hinzu kommt eine 3-Kanal-Messung, bei der wir den Speicher auf DDR3-1333 CL8-8-8-24 übertaktet haben.

DivX 6.8.4: Encoding in s - geringere Werte sind besser
Core i7 965
3,20GHz fix/HT
DDR3-1333CL8/3Ch
77.17
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
76.89
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/2Ch
77.89
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/1Ch
80.13

Der Einfluss der Speicherbandbreite ist minimal und wirkt sich selbst beim Vergleich der Triple- mit der Single-Channel-Messung nur mit gut vier Prozent aus. Wir sehen einen minimalen Vorteil von einem Prozent für den 3-Kanal-Betrieb im Vergleich zur 2-Kanal-Bestückung, das Anheben des Speichertaktes auf DDR3-1333 CL8 bremst die Umwandlung hingegen etwas aus.




Intel Core i7 Extreme 965, 940 und 920 im Test (Bloomfield) - Druckansicht - Seite 21 von 39

Nero Vision 9: Video-Encoding
Nero Vision ist in der beliebten Brenn- und Authoring-Suite Nero 9 enthalten. Wir nutzen dieses Programm, um unsere 120 Sekunden lange Videosequenz von MPEG2 (720x526, 29,97 fps) nach MPEG2 HDTV 1080i zu exportieren. Diese Umwandlung an sich mag nicht sonderlich sinnig sein, doch Nero Vision nutzt hierbei mehr als vier Threads, so dass der Core i7 sein Hyperthreading ins Spiel bringen kann.

Taktung und Architektur
Um die Leistungsmessungen etwas übersichtlicher aufzubreiten, haben wir sie in unterschiedliche Schwerpunkte gegliedert. Im ersten Diagramm stehen die verschiedenen Architekturen und Taktraten im Vordergrund. Um eine bessere Vergleichbarkeit zu gewährleisten, haben wir den Turbo Modus in allen Durchläufen des Core i7 deaktiviert.

Nero Vision 9: Encoding in s - geringere Werte sind besser
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
89.68
Core i7 940
2,93GHz fix/HT
DDR3-1066CL7/3Ch
95.67
Core i7 920
2,66GHz fix/HT
DDR3-1066CL7/3Ch
103.56
Core 2 QX9770
3,20GHz fix/no HT
DDR3-1333CL8/2Ch
115.29
Core 2 QX6800
2,93GHz fix/no HT
DDR3-1066CL7/2Ch
137.00

Nehmen wir die Zeit des Core i7 Extreme 965 als 100 Prozent an, braucht der Core i7 940 knapp 6,7 Prozent und der Core i7 920 knapp 15,5 Prozent länger. Damit skaliert der Nehalem mit Nero Vision beinahe ebenso gut wie mit DivX.
Ausgehend vom Core 2 Extreme QX9770 beschleunigt der Core i7 Extreme 965 die Bearbeitungszeit um deutliche 22 Prozent. Selbst der mit lediglich 2,66 GHz getaktete Core i7 920 ist noch 10 Prozent schneller als der teuerste Penryn.

Turbo Modus
Der Turbo Modus hebt bei Core i7 Prozessoren den Takt der Kerne um maximal eine Stufe bzw. 133,33 MHz an. Wird nur ein Kern belastet, sind auch zwei Stufen bzw. 266,66 MHz möglich. Für den Core i7 920 bedeutet dies eine theoretische Leistungssteigerung um 5 bis 10 Prozent, für höher getaktete Modelle fällt der prozentuale Zuwachs entsprechend geringer aus. Beim Spitzenmodell Core i7 Extreme 965 wären es lediglich 4,17 bis 8,33 Prozent, weshalb wir dort manuell eine Steigerung um drei Stufen bzw. 400 MHz (12,5 Prozent) freigegeben haben. Diese manuelle Anhebung ist nur bei der Extreme-Version möglich.

Nero Vision 9: Encoding in s - geringere Werte sind besser
Core i7 965
3,20GHz dyn/HT
DDR3-1066CL7/3Ch
80.93
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
89.68
Core i7 940
2,93GHz dyn/HT
DDR3-1066CL7/3Ch
92.40
Core i7 940
2,93GHz fix/HT
DDR3-1066CL7/3Ch
95.67
Core i7 920
2,66GHz dyn/HT
DDR3-1066CL7/3Ch
99.10
Core i7 920
2,66GHz fix/HT
DDR3-1066CL7/3Ch
103.56

Der Turbo Modus verkürzt den Export des Videos beim Core i7 Extreme 965 um knapp 10 Prozent, beim Core i7 940 sind es 3,4 Prozent und beim Core i7 920 lediglich 4,3 Prozent.

Hyperthreading
Der dritte Schwerpunkt ist Hyperthreading, denn während diese Funktion für Anwendungen, welche mehr als vier Kerne nutzen können, ein Segen ist, kommen einige Programme, welche weniger Kerne auslasten, zuweilen ins Straucheln.

DivX 6.8.4: Encoding in s - geringere Werte sind besser
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
89.68
Core i7 965
3,20GHz fix/no HT
DDR3-1066CL7/3Ch
97.24
Core 2 QX9770
3,20GHz fix/no HT
DDR3-1333CL8/2Ch
115.29

Schalten wir Hyperthreading ab, bricht die Leistung des Nehalem um 8,5 Prozent ein. Doch auch im Duell ohne Hyperthreading sehen wir eine um deutliche 16 Prozent schnellere Bearbeitung als beim Core 2 Extreme QX9770.

Speicherbandbreite
Auch die Speicherbandbreite kann einen Einfluss auf die Leistungsmessungen haben. Intels Core i7 unterstützt maximal drei Speicherkanäle, welche wir jeweils mit 1 GByte DDR3-1066 CL7-7-7-21 Modulen von Qimonda bestückt haben. Für die Durchläufe mit zwei und einem Speicherkanal kommen je zwei dieser Speicherriegel zum Einsatz. Hinzu kommt eine 3-Kanal-Messung, bei der wir den Speicher auf DDR3-1333 CL8-8-8-24 übertaktet haben.

DivX 6.8.4: Encoding in s - geringere Werte sind besser
Core i7 965
3,20GHz fix/HT
DDR3-1333CL8/3Ch
87.92
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
89.68
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/2Ch
91.83
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/1Ch
97.92

Abermals wirkt sich die Speicherbandbreite erst dann deutlich aus, wenn wir nur einen Kanal des Speicher-Controllers verwenden. Dies führt im Vergleich zur 3-Kanal-Messung zu einem ähnlich deutlichen Einbruch (-9,2%) wie das Abschalten des Hyperthreading. Die Nachteile des 2-Kanal-Betriebs fallen mit 2,4 Prozent deutlich weniger ins Gewicht, die Triple-Channel-Konfiguration mit DDR3-1333 CL8 bringt eine Mehrleistung von lediglich 2 Prozent.




Intel Core i7 Extreme 965, 940 und 920 im Test (Bloomfield) - Druckansicht - Seite 22 von 39

Windows Movie Maker: Video-Encoding
Als dritte und letzte Video-Software verwenden wir den Windows Movie Maker, welcher zum Lieferumfang von Windows Vista Ultimate gehört. Abermals konvertieren wir die 120 Sekunden lange Videosequenz - diesmal von MPEG2 (720x526, 29,97 fps) in Windows Media HD1080p - und stoppen die Zeit. Da diese Software deutlich abweichende Ergebnisse zeigte, haben wir die Zahl der Messläufe von drei auf fünf erhöht.

Taktung und Architektur
Um die Leistungsmessungen etwas übersichtlicher aufzubreiten, haben wir sie in unterschiedliche Schwerpunkte gegliedert. Im ersten Diagramm stehen die verschiedenen Architekturen und Taktraten im Vordergrund. Um eine bessere Vergleichbarkeit zu gewährleisten, haben wir den Turbo Modus in allen Durchläufen des Core i7 deaktiviert.

Windows Movie Maker: Encoding in s - geringere Werte sind besser
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
73.57
Core i7 940
2,93GHz fix/HT
DDR3-1066CL7/3Ch
75.64
Core i7 920
2,66GHz fix/HT
DDR3-1066CL7/3Ch
81.57
Core 2 QX9770
3,20GHz fix/no HT
DDR3-1333CL8/2Ch
80.17
Core 2 QX6800
2,93GHz fix/no HT
DDR3-1066CL7/2Ch
95.72

Beim Windows Movie Maker skaliert der Core i7 deutlich schlechter, so dass der Core i7 940 lediglich 2,8 Prozent und der Core i7 920 knapp 11 Prozent länger benötigen als das Top-Modell Core i7 Extreme 965.
Ausgehend vom Core 2 Extreme QX9770 stellt der Wechsel zum gleichschnell getakteten Nehalem eine Verkürzung der Bearbeitungszeit um 8,23 Prozent dar. Das Top-Modell der Penryn-Generation kann sich damit knapp am Core i7 920 vorbeischieben.

Turbo Modus
Der Turbo Modus hebt bei Core i7 Prozessoren den Takt der Kerne um maximal eine Stufe bzw. 133,33 MHz an. Wird nur ein Kern belastet, sind auch zwei Stufen bzw. 266,66 MHz möglich. Für den Core i7 920 bedeutet dies eine theoretische Leistungssteigerung um 5 bis 10 Prozent, für höher getaktete Modelle fällt der prozentuale Zuwachs entsprechend geringer aus. Beim Spitzenmodell Core i7 Extreme 965 wären es lediglich 4,17 bis 8,33 Prozent, weshalb wir dort manuell eine Steigerung um drei Stufen bzw. 400 MHz (12,5 Prozent) freigegeben haben. Diese manuelle Anhebung ist nur bei der Extreme-Version möglich.

Windows Movie Maker: Encoding in s - geringere Werte sind besser
Core i7 965
3,20GHz dyn/HT
DDR3-1066CL7/3Ch
69.67
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
73.57
Core i7 940
2,93GHz dyn/HT
DDR3-1066CL7/3Ch
73.74
Core i7 940
2,93GHz fix/HT
DDR3-1066CL7/3Ch
75.64
Core i7 920
2,66GHz dyn/HT
DDR3-1066CL7/3Ch
79.82
Core i7 920
2,66GHz fix/HT
DDR3-1066CL7/3Ch
81.57

Mit dem Turbo Modus erzielen wir beim Core i7 Extreme 965 einen Zuwachs um magere 5,3 Prozent. Noch weniger macht sich die Taktanhebung bei Core i7 940 und 920 bemerkbar, der Leistungsgewinn liegt hier unter 2,5 Prozent.

Hyperthreading
Der dritte Schwerpunkt ist Hyperthreading, denn während diese Funktion für Anwendungen, welche mehr als vier Kerne nutzen können, ein Segen ist, kommen einige Programme, welche weniger Kerne auslasten, zuweilen ins Straucheln.

Windows Movie Maker: Encoding in s - geringere Werte sind besser
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
73.57
Core i7 965
3,20GHz fix/no HT
DDR3-1066CL7/3Ch
64.68
Core 2 QX9770
3,20GHz fix/no HT
DDR3-1333CL8/2Ch
80.17

Wie schon bei DivX macht sich Hyperthreading auch beim Windows Movie Maker negativ bemerkbar, allerdings fällt der Unterschied diesmal noch deutlicher aus. Nach dem Ausschalten des Hyperthreading verkürzt sich die Rechenezeit um 12 Prozent. Ausgehend vom Core 2 Extreme QX9770 ist der Core i7 Extreme 965 ohne Hyperthreading beinahe 20 Prozent schneller.

Speicherbandbreite
Auch die Speicherbandbreite kann einen Einfluss auf die Leistungsmessungen haben. Intels Core i7 unterstützt maximal drei Speicherkanäle, welche wir jeweils mit 1 GByte DDR3-1066 CL7-7-7-21 Modulen von Qimonda bestückt haben. Für die Durchläufe mit zwei und einem Speicherkanal kommen je zwei dieser Speicherriegel zum Einsatz. Hinzu kommt eine 3-Kanal-Messung, bei der wir den Speicher auf DDR3-1333 CL8-8-8-24 übertaktet haben.

Windows Movie Maker: Encoding in s - geringere Werte sind besser
Core i7 965
3,20GHz fix/HT
DDR3-1333CL8/3Ch
71.37
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
73.57
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/2Ch
72.53
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/1Ch
81.18

Der Einfluss der Speicherbandbreite macht sich nur dann stark bemerkbar, wenn wir nur einen Kanal verwenden: Hier steigt die Bearbeitungszeit um gut 10 Prozent an. Der Dual-Channel-Durchlauf ist hingegen um 1,4 Prozent schneller als die Messung mit drei Speicherkanälen, DDR3-1333 CL8 verkürzt die Rechenzeit um knapp 3 Prozent.




Intel Core i7 Extreme 965, 940 und 920 im Test (Bloomfield) - Druckansicht - Seite 23 von 39

Lame 3.98.2: Audio-Encoding
Lame ist ein beliebter, quelloffener Audio-Encoder, mit dem wir eine 78:13 Minuten lange Audio-Datei (WAV, 16 Bit, 44,1 kHz, 789 MByte) in MP3 (320 kbps, 44,1 KHz) umwandeln. Wir verwenden die Qualitätseinstellung VHQ (Very High Quality). Lame nutzt in diesem Test lediglich einen Thread.

Taktung und Architektur
Um die Leistungsmessungen etwas übersichtlicher aufzubreiten, haben wir sie in unterschiedliche Schwerpunkte gegliedert. Im ersten Diagramm stehen die verschiedenen Architekturen und Taktraten im Vordergrund. Um eine bessere Vergleichbarkeit zu gewährleisten, haben wir den Turbo Modus in allen Durchläufen des Core i7 deaktiviert.

Lame 3.98.2: Encoding in s - geringere Werte sind besser
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
233
Core i7 940
2,93GHz fix/HT
DDR3-1066CL7/3Ch
255
Core i7 920
2,66GHz fix/HT
DDR3-1066CL7/3Ch
279
Core 2 QX9770
3,20GHz fix/no HT
DDR3-1333CL8/2Ch
232
Core 2 QX6800
2,93GHz fix/no HT
DDR3-1066CL7/2Ch
260

Mit Lame sehen wir eine sehr deutliche Skalierung: Ausgehend von der Bearbeitungszeit des Core i7 Extreme 965 ist der Core i7 940 gut 9,4 Prozent langsamer und der Core i7 920 braucht gut 19,7 Prozent länger, um die MP3-Datei zu erstellen.
Ohne den Ballast des Hyperthreading ist der Core 2 Extreme QX9770 eine Sekunde schneller fertig und selbst der 65 nm Core 2 Extreme QX6800 kann noch gut mit dem Core i7 940 mithalten.

Turbo Modus
Der Turbo Modus hebt bei Core i7 Prozessoren den Takt der Kerne um maximal eine Stufe bzw. 133,33 MHz an. Wird nur ein Kern belastet, sind auch zwei Stufen bzw. 266,66 MHz möglich. Für den Core i7 920 bedeutet dies eine theoretische Leistungssteigerung um 5 bis 10 Prozent, für höher getaktete Modelle fällt der prozentuale Zuwachs entsprechend geringer aus. Beim Spitzenmodell Core i7 Extreme 965 wären es lediglich 4,17 bis 8,33 Prozent, weshalb wir dort manuell eine Steigerung um drei Stufen bzw. 400 MHz (12,5 Prozent) freigegeben haben. Diese manuelle Anhebung ist nur bei der Extreme-Version möglich.

Lame 3.98.2: Encoding in s - geringere Werte sind besser
Core i7 965
3,20GHz dyn/HT
DDR3-1066CL7/3Ch
206
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
233
Core i7 940
2,93GHz dyn/HT
DDR3-1066CL7/3Ch
232
Core i7 940
2,93GHz fix/HT
DDR3-1066CL7/3Ch
255
Core i7 920
2,66GHz dyn/HT
DDR3-1066CL7/3Ch
254
Core i7 920
2,66GHz fix/HT
DDR3-1066CL7/3Ch
279

Der Turbo Modus verkürzt die Bearbeitungsdauer beim Core i7 Extreme 965 um ca. 11,6 Prozent. Core i7 940 und 920 können sich jeweils um eine Modellstufe verbessern, da der CPU-Takt entsprechend um 266,66 MHz ansteigt. Abermals sind die hochgetakteten CPUs ein wenig schneller, was auf schärfere Latenzen schließen lässt.

Hyperthreading
Der dritte Schwerpunkt ist Hyperthreading, denn während diese Funktion für Anwendungen, welche mehr als vier Kerne nutzen können, ein Segen ist, kommen einige Programme, welche weniger Kerne auslasten, zuweilen ins Straucheln.

Lame 3.98.2: Encoding in s - geringere Werte sind besser
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
233
Core i7 965
3,20GHz fix/no HT
DDR3-1066CL7/3Ch
231
Core 2 QX9770
3,20GHz fix/no HT
DDR3-1333CL8/2Ch
232

Schalten wir Hyperthreading ab, ist der Core i7 Extreme 965 um eine Sekunde schneller als der Core 2 Extreme QX9770. Dennoch zeigt sich anhand von Lame, dass bei weitem nicht jede Anwendung von der neuen Architektur profitiert und die Verwandschaft von Penryn und Nehalem doch noch recht groß ist.

Speicherbandbreite
Auch die Speicherbandbreite kann einen Einfluss auf die Leistungsmessungen haben. Intels Core i7 unterstützt maximal drei Speicherkanäle, welche wir jeweils mit 1 GByte DDR3-1066 CL7-7-7-21 Modulen von Qimonda bestückt haben. Für die Durchläufe mit zwei und einem Speicherkanal kommen je zwei dieser Speicherriegel zum Einsatz. Hinzu kommt eine 3-Kanal-Messung, bei der wir den Speicher auf DDR3-1333 CL8-8-8-24 übertaktet haben.

Lame 3.98.2: Encoding in s - geringere Werte sind besser
Core i7 965
3,20GHz fix/HT
DDR3-1333CL8/3Ch
232
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
233
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/2Ch
232
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/1Ch
232

Interessiert sich hier jemand für die Speicherbandbreite? Schön, Lame tut es jedenfalls nicht.




Intel Core i7 Extreme 965, 940 und 920 im Test (Bloomfield) - Druckansicht - Seite 24 von 39

Audacity 1.3.5: Audio-Bearbeitung
Bei Audacity handelt es sich um einen quelloffenen Audio-Editor, welcher für diverse Plattformen angeboten wird. Für unseren Test laden wir unsere 78:13 Minuten lange Audio-Datei (WAV, 16 Bit, 44,1 kHz, 789 MByte) und ändern die Geschwindigkeit von 33,33 auf 45 Umdrehungen pro Minute. Dies ist eine typische Bearbeitungsaufgabe, wenn eine Schallplatte mit der falschen Geschwindigkeit digitalisiert wurde oder die geringere Drehzahl genutzt wurde, um die Auswirkung von Kratzern zu minimieren.

Taktung und Architektur
Um die Leistungsmessungen etwas übersichtlicher aufzubreiten, haben wir sie in unterschiedliche Schwerpunkte gegliedert. Im ersten Diagramm stehen die verschiedenen Architekturen und Taktraten im Vordergrund. Um eine bessere Vergleichbarkeit zu gewährleisten, haben wir den Turbo Modus in allen Durchläufen des Core i7 deaktiviert.

Audacity 1.3.5: Audio-Bearbeitung in s - geringere Werte sind besser
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
99
Core i7 940
2,93GHz fix/HT
DDR3-1066CL7/3Ch
105
Core i7 920
2,66GHz fix/HT
DDR3-1066CL7/3Ch
115
Core 2 QX9770
3,20GHz fix/no HT
DDR3-1333CL8/2Ch
110
Core 2 QX6800
2,93GHz fix/no HT
DDR3-1066CL7/2Ch
119

Auch Audacity zeigt eine ordentliche Skalierung der Nehalems: Nehmen wir den Core i7 Extreme 965 als Ausgangspunkt, benötigt der Core i7 940 gut 6 Prozent und der Core i7 920 knapp 16 Prozent mehr Zeit für die Bearbeitung.
Überraschend deutlich fällt der Vorsprung des Core i7 Extreme 965 auf den Core 2 Extreme QX9770 aus. Ausgehend vom Penryn zeigt der Nehalem eine Leistungssteigerung um 11,11 Prozent. Der Core 2 Extreme QX9770 findet sich somit genau in der Mitte zwischen Core i7 940 und Core i7 920.

Turbo Modus
Der Turbo Modus hebt bei Core i7 Prozessoren den Takt der Kerne um maximal eine Stufe bzw. 133,33 MHz an. Wird nur ein Kern belastet, sind auch zwei Stufen bzw. 266,66 MHz möglich. Für den Core i7 920 bedeutet dies eine theoretische Leistungssteigerung um 5 bis 10 Prozent, für höher getaktete Modelle fällt der prozentuale Zuwachs entsprechend geringer aus. Beim Spitzenmodell Core i7 Extreme 965 wären es lediglich 4,17 bis 8,33 Prozent, weshalb wir dort manuell eine Steigerung um drei Stufen bzw. 400 MHz (12,5 Prozent) freigegeben haben. Diese manuelle Anhebung ist nur bei der Extreme-Version möglich.

Audacity 1.3.5: Audio-Bearbeitung in s - geringere Werte sind besser
Core i7 965
3,20GHz dyn/HT
DDR3-1066CL7/3Ch
91
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
99
Core i7 940
2,93GHz dyn/HT
DDR3-1066CL7/3Ch
103
Core i7 940
2,93GHz fix/HT
DDR3-1066CL7/3Ch
105
Core i7 920
2,66GHz dyn/HT
DDR3-1066CL7/3Ch
108
Core i7 920
2,66GHz fix/HT
DDR3-1066CL7/3Ch
115

Der Turbo Modus verkürzt unsere Wartezeit beim Core i7 Extreme 965 um 8 Prozent, beim Core i7 920 sind es 7 Prozent und beim Core i7 940 lediglich 2 Prozent.

Hyperthreading
Der dritte Schwerpunkt ist Hyperthreading, denn während diese Funktion für Anwendungen, welche mehr als vier Kerne nutzen können, ein Segen ist, kommen einige Programme, welche weniger Kerne auslasten, zuweilen ins Straucheln.

Audacity 1.3.5: Audio-Bearbeitung in s - geringere Werte sind besser
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
99
Core i7 965
3,20GHz fix/no HT
DDR3-1066CL7/3Ch
99
Core 2 QX9770
3,20GHz fix/no HT
DDR3-1333CL8/2Ch
110

Vom Hyperthreading hat Audacity herzlich wenig, der Vorsprung auf den Penryn bleibt auch ohne diese Technologie unverändert.

Speicherbandbreite
Auch die Speicherbandbreite kann einen Einfluss auf die Leistungsmessungen haben. Intels Core i7 unterstützt maximal drei Speicherkanäle, welche wir jeweils mit 1 GByte DDR3-1066 CL7-7-7-21 Modulen von Qimonda bestückt haben. Für die Durchläufe mit zwei und einem Speicherkanal kommen je zwei dieser Speicherriegel zum Einsatz. Hinzu kommt eine 3-Kanal-Messung, bei der wir den Speicher auf DDR3-1333 CL8-8-8-24 übertaktet haben.

Audacity 1.3.5: Audio-Bearbeitung in s - geringere Werte sind besser
Core i7 965
3,20GHz fix/HT
DDR3-1333CL8/3Ch
99
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
99
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/2Ch
100
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/1Ch
102

Die Speicherbandbreite wirkt sich nur geringfügig auf diese Messung aus, der Unterschied zwischen Triple-Channel DDR3-1333 CL 8 und Single-Channel DDR3-1066 CL7 liegt bei mageren 3 Prozent.




Intel Core i7 Extreme 965, 940 und 920 im Test (Bloomfield) - Druckansicht - Seite 25 von 39

OpenOffice.org 3.0.0: PDF-Export
Kommen wir nun zu einer Office-Anwendung. OpenOffice.org ist eine komplette, quelloffene Office-Suite und wir werden ein Text-Dokument (ODT, 96,8 MByte) mit aufwändigem Layout und zahlreichen Fotos als PDF exportieren. Die exportierte PDF-Datei hat eine Größe von 11,6 MByte. Wir stoppen die Zeit, welche OpenOffice.org für diese alltägliche Büroaufgabe benötigt.

Taktung und Architektur
Um die Leistungsmessungen etwas übersichtlicher aufzubreiten, haben wir sie in unterschiedliche Schwerpunkte gegliedert. Im ersten Diagramm stehen die verschiedenen Architekturen und Taktraten im Vordergrund. Um eine bessere Vergleichbarkeit zu gewährleisten, haben wir den Turbo Modus in allen Durchläufen des Core i7 deaktiviert.

OpenOffice.org 3.0.0: PDF-Export in s - geringere Werte sind besser
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
23.54
Core i7 940
2,93GHz fix/HT
DDR3-1066CL7/3Ch
25.68
Core i7 920
2,66GHz fix/HT
DDR3-1066CL7/3Ch
27.83
Core 2 QX9770
3,20GHz fix/no HT
DDR3-1333CL8/2Ch
24.81
Core 2 QX6800
2,93GHz fix/no HT
DDR3-1066CL7/2Ch
27.64

Dass der Core i7 auch beim PDF-Export aus OpenOffice.org so deutlich skaliert, hatten wir gar nicht erwartet. Ausgehend vom Core i7 Extreme 965 benötigt der Core i7 940 gut 9 Prozent und der Core i7 920 gut 18 Prozent länger.
Nehmen wir nun den Core 2 Extreme QX9770 als 100 Prozent, bringt der Umstieg auf den Core i7 Extreme 965 eine Leistungssteigerung um gut 5 Prozent. Der schnellste Penryn ordnet sich somit zwischen Core i7 Extreme 965 und Core i7 940 ein.

Turbo Modus
Der Turbo Modus hebt bei Core i7 Prozessoren den Takt der Kerne um maximal eine Stufe bzw. 133,33 MHz an. Wird nur ein Kern belastet, sind auch zwei Stufen bzw. 266,66 MHz möglich. Für den Core i7 920 bedeutet dies eine theoretische Leistungssteigerung um 5 bis 10 Prozent, für höher getaktete Modelle fällt der prozentuale Zuwachs entsprechend geringer aus. Beim Spitzenmodell Core i7 Extreme 965 wären es lediglich 4,17 bis 8,33 Prozent, weshalb wir dort manuell eine Steigerung um drei Stufen bzw. 400 MHz (12,5 Prozent) freigegeben haben. Diese manuelle Anhebung ist nur bei der Extreme-Version möglich.

OpenOffice.org 3.0.0: PDF-Export in s - geringere Werte sind besser
Core i7 965
3,20GHz dyn/HT
DDR3-1066CL7/3Ch
21.53
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
23.54
Core i7 940
2,93GHz dyn/HT
DDR3-1066CL7/3Ch
24.77
Core i7 940
2,93GHz fix/HT
DDR3-1066CL7/3Ch
25.68
Core i7 920
2,66GHz dyn/HT
DDR3-1066CL7/3Ch
26.36
Core i7 920
2,66GHz fix/HT
DDR3-1066CL7/3Ch
27.83

Mit dem Turbo Modus können wir die Bearbeitungszeit des Core i7 Extreme 965 um 8,5 Prozent verkürzen, der Core i7 940 ist gut 3,5 Prozent schneller fertig und der Core i7 920 reduziert die Exportzeit um knapp 5,3 Prozent.

Hyperthreading
Der dritte Schwerpunkt ist Hyperthreading, denn während diese Funktion für Anwendungen, welche mehr als vier Kerne nutzen können, ein Segen ist, kommen einige Programme, welche weniger Kerne auslasten, zuweilen ins Straucheln.

OpenOffice.org 3.0.0: PDF-Export in s - geringere Werte sind besser
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
23.54
Core i7 965
3,20GHz fix/no HT
DDR3-1066CL7/3Ch
23.90
Core 2 QX9770
3,20GHz fix/no HT
DDR3-1333CL8/2Ch
24.81

Ohne Hyperthreading steigt die Bearbeitungszeit um 1,5 Prozent an, dennoch liegt der Core 2 Extreme 9770 auch weiterhin eine knappe Sekunde zurück.

Speicherbandbreite
Auch die Speicherbandbreite kann einen Einfluss auf die Leistungsmessungen haben. Intels Core i7 unterstützt maximal drei Speicherkanäle, welche wir jeweils mit 1 GByte DDR3-1066 CL7-7-7-21 Modulen von Qimonda bestückt haben. Für die Durchläufe mit zwei und einem Speicherkanal kommen je zwei dieser Speicherriegel zum Einsatz. Hinzu kommt eine 3-Kanal-Messung, bei der wir den Speicher auf DDR3-1333 CL8-8-8-24 übertaktet haben.

OpenOffice.org 3.0.0: PDF-Export in s - geringere Werte sind besser
Core i7 965
3,20GHz fix/HT
DDR3-1333CL8/3Ch
24.01
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
23.54
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/2Ch
23.79
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/1Ch
24.43

Der Schritt von drei auf zwei Speicherkanäle wirkt sich mit gerade einmal einem Prozent aus, zum 1-Kanal-Betrieb sind es immerhin 3,8 Prozent. DDR3-1333 CL 8 bringt uns in diesem Test keinen Vorteil, jeder einzelne der fünf Testläufe blieb hinter der DDR3-1066 CL7 Bestückung zurück.




Intel Core i7 Extreme 965, 940 und 920 im Test (Bloomfield) - Druckansicht - Seite 26 von 39

3DMark06 1.1.0: CPU-Wertung
Der beliebte 3D-Test 3DMark06 enthält eine CPU-Wertung, welcher wir uns im Folgenden ansehen wollen. Dieses Benchmarkprogramm kann mehr als vier Threads nutzen, so dass sich Hyperthreading für den Nehalem auszahlen sollte.

Taktung und Architektur
Um die Leistungsmessungen etwas übersichtlicher aufzubreiten, haben wir sie in unterschiedliche Schwerpunkte gegliedert. Im ersten Diagramm stehen die verschiedenen Architekturen und Taktraten im Vordergrund. Um eine bessere Vergleichbarkeit zu gewährleisten, haben wir den Turbo Modus in allen Durchläufen des Core i7 deaktiviert.

3DMark06: CPU-Wertung
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
5569
Core i7 940
2,93GHz fix/HT
DDR3-1066CL7/3Ch
5158
Core i7 920
2,66GHz fix/HT
DDR3-1066CL7/3Ch
4706
Core 2 QX9770
3,20GHz fix/no HT
DDR3-1333CL8/2Ch
4812
Core 2 QX6800
2,93GHz fix/no HT
DDR3-1066CL7/2Ch
4119

Ausgehend vom Core i7 Extreme 965 ist der Core i7 940 um 7,4 Prozent und der Core i7 920 um 15,5 Prozent langsamer, womit diese Messung den Taktstufen der drei Prozessoren recht nahe kommt.
Nehmen wir nun den Core 2 Extreme QX9770 als Basis, bringt der Umstieg auf den Core i7 Extreme 965 einen Leistungsgewinn von knapp 16 Prozent. Der schnellste Penryn kann zwar am Core i7 920 vorbeiziehen, bleibt aber deutlich hinter dem Core i7 940 zurück.

Turbo Modus
Der Turbo Modus hebt bei Core i7 Prozessoren den Takt der Kerne um maximal eine Stufe bzw. 133,33 MHz an. Wird nur ein Kern belastet, sind auch zwei Stufen bzw. 266,66 MHz möglich. Für den Core i7 920 bedeutet dies eine theoretische Leistungssteigerung um 5 bis 10 Prozent, für höher getaktete Modelle fällt der prozentuale Zuwachs entsprechend geringer aus. Beim Spitzenmodell Core i7 Extreme 965 wären es lediglich 4,17 bis 8,33 Prozent, weshalb wir dort manuell eine Steigerung um drei Stufen bzw. 400 MHz (12,5 Prozent) freigegeben haben. Diese manuelle Anhebung ist nur bei der Extreme-Version möglich.

3DMark06: CPU-Wertung
Core i7 965
3,20GHz dyn/HT
DDR3-1066CL7/3Ch
6177
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
5569
Core i7 940
2,93GHz dyn/HT
DDR3-1066CL7/3Ch
5355
Core i7 940
2,93GHz fix/HT
DDR3-1066CL7/3Ch
5158
Core i7 920
2,66GHz dyn/HT
DDR3-1066CL7/3Ch
4927
Core i7 920
2,66GHz fix/HT
DDR3-1066CL7/3Ch
4706

Der Turbo Modus steigert das Ergebnis des Core i7 Extreme 965 um knapp 11 Prozent während der Core i7 940 um 3,8 Prozent und der Core i7 920 um 4,7 Prozent zulegen kann.

Hyperthreading
Der dritte Schwerpunkt ist Hyperthreading, denn während diese Funktion für Anwendungen, welche mehr als vier Kerne nutzen können, ein Segen ist, kommen einige Programme, welche weniger Kerne auslasten, zuweilen ins Straucheln.

3DMark06: CPU-Wertung
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
5569
Core i7 965
3,20GHz fix/no HT
DDR3-1066CL7/3Ch
5035
Core 2 QX9770
3,20GHz fix/no HT
DDR3-1333CL8/2Ch
4812

Den Großteil seines Leistungsgewinnes zieht der Core i7 Extreme 965 aus dem Hyperthreading, ohne diese Technologie bricht sein Ergebnis um 9,6 Prozent ein.

Speicherbandbreite
Auch die Speicherbandbreite kann einen Einfluss auf die Leistungsmessungen haben. Intels Core i7 unterstützt maximal drei Speicherkanäle, welche wir jeweils mit 1 GByte DDR3-1066 CL7-7-7-21 Modulen von Qimonda bestückt haben. Für die Durchläufe mit zwei und einem Speicherkanal kommen je zwei dieser Speicherriegel zum Einsatz. Hinzu kommt eine 3-Kanal-Messung, bei der wir den Speicher auf DDR3-1333 CL8-8-8-24 übertaktet haben.

3DMark06: CPU-Wertung
Core i7 965
3,20GHz fix/HT
DDR3-1333CL8/3Ch
5585
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
5569
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/2Ch
5583
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/1Ch
5565

Die Speicherbandbreite ist für diesen Test völlig uninteressant, alle Messungen liegen innerhalb einer Abweichung von 0,36 Prozent.




Intel Core i7 Extreme 965, 940 und 920 im Test (Bloomfield) - Druckansicht - Seite 27 von 39

3DMark06 1.1.0: Gesamtwertung
In die Gesamtwertung von 3DMark06 fließen neben der CPU-Messung auch jeweils zwei Grafiktests mit Shader Model 2.0 und 3.0 (HDR) ein. Das Shader Model 3.0 Ergebnis dominiert dabei die Wertung. Wir haben diesen Testlauf in der Auflösung 1280 x 1024 ohne Kantenglättung durchgeführt, als Grafikkarte kam eine MSI R4870X2-T2D2G-OC mit Grafiktreiber Catalyst 8.10 zum Einsatz.

Taktung und Architektur
Um die Leistungsmessungen etwas übersichtlicher aufzubreiten, haben wir sie in unterschiedliche Schwerpunkte gegliedert. Im ersten Diagramm stehen die verschiedenen Architekturen und Taktraten im Vordergrund. Um eine bessere Vergleichbarkeit zu gewährleisten, haben wir den Turbo Modus in allen Durchläufen des Core i7 deaktiviert.

3DMark06: Gesamtwertung
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
19423
Core i7 940
2,93GHz fix/HT
DDR3-1066CL7/3Ch
17998
Core i7 920
2,66GHz fix/HT
DDR3-1066CL7/3Ch
16919
Core 2 QX9770
3,20GHz fix/no HT
DDR3-1333CL8/2Ch
18295
Core 2 QX6800
2,93GHz fix/no HT
DDR3-1066CL7/2Ch
16334

Obwohl das Gesamtergebnis von 3DMark06 primär auf der Grafikleistung basiert, sehen wir dennoch eine glasklare Skalierung der Nehalems: Nehmen wir den Core i7 Extreme 965 als Ausgangspunkt, so ist der Core i7 940 gut 7,3 Prozent und der Core i7 920 knapp 12,9 Prozent langsamer.
Betrachten wir das Resultat des Core 2 Extreme QX9770 als 100 Prozent, so verbucht der Core i7 Extreme 965 eine Steigerung um gut 6 Prozent. Dennoch kann sich der Penryn gegen den Core i7 940 durchsetzen.

Turbo Modus
Der Turbo Modus hebt bei Core i7 Prozessoren den Takt der Kerne um maximal eine Stufe bzw. 133,33 MHz an. Wird nur ein Kern belastet, sind auch zwei Stufen bzw. 266,66 MHz möglich. Für den Core i7 920 bedeutet dies eine theoretische Leistungssteigerung um 5 bis 10 Prozent, für höher getaktete Modelle fällt der prozentuale Zuwachs entsprechend geringer aus. Beim Spitzenmodell Core i7 Extreme 965 wären es lediglich 4,17 bis 8,33 Prozent, weshalb wir dort manuell eine Steigerung um drei Stufen bzw. 400 MHz (12,5 Prozent) freigegeben haben. Diese manuelle Anhebung ist nur bei der Extreme-Version möglich.

3DMark06: Gesamtwertung
Core i7 965
3,20GHz dyn/HT
DDR3-1066CL7/3Ch
21500
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
19423
Core i7 940
2,93GHz dyn/HT
DDR3-1066CL7/3Ch
19401
Core i7 940
2,93GHz fix/HT
DDR3-1066CL7/3Ch
17998
Core i7 920
2,66GHz dyn/HT
DDR3-1066CL7/3Ch
18015
Core i7 920
2,66GHz fix/HT
DDR3-1066CL7/3Ch
16919

Der Tubro Modus verbessert das Ergebnis des Core i7 Extreme 965 um ca. 10,7 Prozent. Und obwohl die CPU-Wertung von mehreren Kernen profitiert, hat dies auf die Gesamtwertung von 3DMark06 keine Auswirkung: Der Trubo Modus bringt den Core i7 940 und den Core i7 920 auf das Niveau des jeweils nächst schnelleren Modells.

Hyperthreading
Der dritte Schwerpunkt ist Hyperthreading, denn während diese Funktion für Anwendungen, welche mehr als vier Kerne nutzen können, ein Segen ist, kommen einige Programme, welche weniger Kerne auslasten, zuweilen ins Straucheln.

3DMark06: Gesamtwertung
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
19423
Core i7 965
3,20GHz fix/no HT
DDR3-1066CL7/3Ch
20023
Core 2 QX9770
3,20GHz fix/no HT
DDR3-1333CL8/2Ch
18295

Obwohl die CPU-Wertung vom Hyperthreading profitiert, bremst diese Technologie die 3D-Durchläufe aus. Insbesondere die Shader Mode 2.0 Messungen legen ohne Hyperthreading zu, so dass wir insgesamt eine Steigerung um 3 Prozent notieren.

Speicherbandbreite
Auch die Speicherbandbreite kann einen Einfluss auf die Leistungsmessungen haben. Intels Core i7 unterstützt maximal drei Speicherkanäle, welche wir jeweils mit 1 GByte DDR3-1066 CL7-7-7-21 Modulen von Qimonda bestückt haben. Für die Durchläufe mit zwei und einem Speicherkanal kommen je zwei dieser Speicherriegel zum Einsatz. Hinzu kommt eine 3-Kanal-Messung, bei der wir den Speicher auf DDR3-1333 CL8-8-8-24 übertaktet haben.

3DMark06: Gesamtwertung
Core i7 965
3,20GHz fix/HT
DDR3-1333CL8/3Ch
19963
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
19423
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/2Ch
20351
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/1Ch
20241

Hinsichtlich der Speicherbandbreite sehen wir Abweichungen von maximal 4,8 Prozent. Erstaunlich ist allerdings der Umstand, dass die Triple-Channel-Konfigurationen am schlechtesten abschneiden.




Intel Core i7 Extreme 965, 940 und 920 im Test (Bloomfield) - Druckansicht - Seite 28 von 39

Assassin's Creed 1.02
Das Spiel Assassin's Creed feierte zunächst auf den Spielekonsolen Erfolge, bevor es - inklusive DirectX 10 Unterstützung - auch für den PC veröffentlicht wurde. Um einen deutlichen Einfluss der CPU-Leistung nachzuweisen, müssten wir mit einer Auflösung von 800 x 600 Bildpunkten und ohne bildverbessernde Filter arbeiten. In Anbetracht der Hardware, die wir für diesen Test aufgefahren haben, erscheint uns diese iPod-Auflösung allerdings lächerlich. Versuchen wir es doch einmal mit 1280 x 1024 Bildpunkten, Effekte sind an, Multisampling steht auf 1/3, Schatten auf 3/3 und Qualität sowie Detail auf 4/4. Zum Ermitteln der Framerate verwenden wir das Tool Fraps und da solche Messungen immer um einige Frames schwanken, machen wir je nach Grad der Abweichungen zwischen fünf und zehn Durchläufe.

Taktung und Architektur
Um die Leistungsmessungen etwas übersichtlicher aufzubreiten, haben wir sie in unterschiedliche Schwerpunkte gegliedert. Im ersten Diagramm stehen die verschiedenen Architekturen und Taktraten im Vordergrund. Um eine bessere Vergleichbarkeit zu gewährleisten, haben wir den Turbo Modus in allen Durchläufen des Core i7 deaktiviert.

Assassin's Creed: Ø; max; min in fps
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
74.46
239.33
43.33
Core i7 940
2,93GHz fix/HT
DDR3-1066CL7/3Ch
66.55
231.33
42.00
Core i7 920
2,66GHz fix/HT
DDR3-1066CL7/3Ch
62.77
202.33
39.67
Core 2 QX9770
3,20GHz fix/no HT
DDR3-1333CL8/2Ch
67.44
199.33
43.67
Core 2 QX6800
2,93GHz fix/no HT
DDR3-1066CL7/2Ch
56.15
162.67
35.67

Nachdem wir um die 80 Messläufe hinter uns haben, zeichnet sich dann doch ein recht klares Bild ab: Ausgehend vom Core i7 Extreme 965 erreicht der Core i7 940 eine um 10,6 Prozent geringere Framerate, das Einstiegsmodell Core i7 920 ist 15,7 Prozent langsamer.
Setzen wir den Core 2 Extreme QX9770 mit einer Leistung von 100 Prozent an, kann der Core i7 Extreme 965 diese um deutliche 10,4 Prozent übertreffen. Dennoch kann sich der Penryn gegen den Core i7 940 durchsetzen und erzielt nur bei der maximalen Framerate geringere Werte.

Turbo Modus
Der Turbo Modus hebt bei Core i7 Prozessoren den Takt der Kerne um maximal eine Stufe bzw. 133,33 MHz an. Wird nur ein Kern belastet, sind auch zwei Stufen bzw. 266,66 MHz möglich. Für den Core i7 920 bedeutet dies eine theoretische Leistungssteigerung um 5 bis 10 Prozent, für höher getaktete Modelle fällt der prozentuale Zuwachs entsprechend geringer aus. Beim Spitzenmodell Core i7 Extreme 965 wären es lediglich 4,17 bis 8,33 Prozent, weshalb wir dort manuell eine Steigerung um drei Stufen bzw. 400 MHz (12,5 Prozent) freigegeben haben. Diese manuelle Anhebung ist nur bei der Extreme-Version möglich.

Assassin's Creed: Ø; max; min in fps
Core i7 965
3,20GHz dyn/HT
DDR3-1066CL7/3Ch
79.79
279.67
46.67
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
74.46
239.33
43.33
Core i7 940
2,93GHz dyn/HT
DDR3-1066CL7/3Ch
69.87
229.67
43.33
Core i7 940
2,93GHz fix/HT
DDR3-1066CL7/3Ch
66.55
231.33
42.00
Core i7 920
2,66GHz dyn/HT
DDR3-1066CL7/3Ch
65.32
205.67
41.00
Core i7 920
2,66GHz fix/HT
DDR3-1066CL7/3Ch
62.77
202.33
39.67

Der Turbo Modus verschafft dem Core i7 Extreme 965 eine Steigerung um ca. 7,2 Prozent. Beim Core i7 940 steigt die Framerate um knapp 5 Prozent, der Core i7 920 kann sich um 4,2 Prozent verbessern.

Hyperthreading
Der dritte Schwerpunkt ist Hyperthreading, denn während diese Funktion für Anwendungen, welche mehr als vier Kerne nutzen können, ein Segen ist, kommen einige Programme, welche weniger Kerne auslasten, zuweilen ins Straucheln.

Assassin's Creed: Ø; max; min in fps
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
74.46
239.33
43.33
Core i7 965
3,20GHz fix/no HT
DDR3-1066CL7/3Ch
70.53
238.00
44.00
Core 2 QX9770
3,20GHz fix/no HT
DDR3-1333CL8/2Ch
67.44
199.33
43.67

Schalten wir Hyperthreading ab, fällt die Framerate mit dem Core i7 Extreme 965 um 5,28 Prozent, obwohl sich minimale und maximale Werte kaum unterscheiden. Um Hyperthreading bereinigt schmilzt die Mehrleistung des Nehalem im Vergleich zum Penryn auf knapp 4,6 Prozent zusammen.

Speicherbandbreite
Auch die Speicherbandbreite kann einen Einfluss auf die Leistungsmessungen haben. Intels Core i7 unterstützt maximal drei Speicherkanäle, welche wir jeweils mit 1 GByte DDR3-1066 CL7-7-7-21 Modulen von Qimonda bestückt haben. Für die Durchläufe mit zwei und einem Speicherkanal kommen je zwei dieser Speicherriegel zum Einsatz. Hinzu kommt eine 3-Kanal-Messung, bei der wir den Speicher auf DDR3-1333 CL8-8-8-24 übertaktet haben.

Assassin's Creed: Ø; max; min in fps
Core i7 965
3,20GHz fix/HT
DDR3-1333CL8/3Ch
70.36
237.67
44.67
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
74.46
239.33
43.33
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/2Ch
71.28
241.00
41.67
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/1Ch
67.74
224.00
38.33

Die Verringerung der Speicherbandbreite von drei auf zwei Kanäle quittiert der Core i7 965 mit einem Einbruch der Framerate um 4,3 Prozent. Beschränken wir die Speicheranbindung auf einen Kanal, sind es sogar 9 Prozent. Etwas überraschend ist der Umstand, dass wir mit DDR3-1333 CL8 ein Absinken der Framerate um 5,5 Prozent sehen.




Intel Core i7 Extreme 965, 940 und 920 im Test (Bloomfield) - Druckansicht - Seite 29 von 39

Crysis
Das Spiel Crysis baute extrem hohe Erwartungen auf und konnte diese trotz vielversprechender Ansätze nicht ganz einlösen. Insbesondere die hohen Anforderungen an die Hardware sowie der schnell eingestellte Support sorgten bei vielen Spielern für Enttäuschung. Wir messen die Framerate mit dem Crysis Benchmark Tool 1.05 und dem CPU-optimierten Testlauf. Kantenglättung wird nicht verwendet, die Auflösung wurde auf 1280 x 1024 Bildpunkte festgelegt, die Qualität auf hoch. Da die Ergebnisse mit DirectX 10 in Verbindung mit 64-Bit zum Teil keinen Sinn ergaben, haben wir das Spiel mit DirectX 9 vermessen.

Taktung und Architektur
Um die Leistungsmessungen etwas übersichtlicher aufzubreiten, haben wir sie in unterschiedliche Schwerpunkte gegliedert. Im ersten Diagramm stehen die verschiedenen Architekturen und Taktraten im Vordergrund. Um eine bessere Vergleichbarkeit zu gewährleisten, haben wir den Turbo Modus in allen Durchläufen des Core i7 deaktiviert.

Crysis: Ø; max; min in fps
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
73.73
94.30
41.49
Core i7 940
2,93GHz fix/HT
DDR3-1066CL7/3Ch
68.70
86.96
39.65
Core i7 920
2,66GHz fix/HT
DDR3-1066CL7/3Ch
64.26
81.31
36.95
Core 2 QX9770
3,20GHz fix/no HT
DDR3-1333CL8/2Ch
62.70
79.89
34.18
Core 2 QX6800
2,93GHz fix/no HT
DDR3-1066CL7/2Ch
52.84
68.65
29.02

Auch Crysis verlangte uns unzählige Messläufe ab, am Ende sehen wir folgendes Bild: Setzten wir die Framerate des Core i7 Extreme 965 als 100 Prozent fest, liegt der Core i7 940 um 6,8 Prozent und der Core i7 920 um 12,8 Prozent zurück.
Ausgehend vom Core 2 Extreme QX9770 bringt der Umstieg auf den Core i7 Extreme 965 eine Mehrleistung von erstaunlichen 17,6 Prozent. Hierbei spielen nicht nur Architekturvorteile sondern auch die Speicherbandbreite eine entscheidende Rolle. So muss sich das Top-Modell der Penryn-Familie sogar dem Core i7 920 geschlagen geben.

Turbo Modus
Der Turbo Modus hebt bei Core i7 Prozessoren den Takt der Kerne um maximal eine Stufe bzw. 133,33 MHz an. Wird nur ein Kern belastet, sind auch zwei Stufen bzw. 266,66 MHz möglich. Für den Core i7 920 bedeutet dies eine theoretische Leistungssteigerung um 5 bis 10 Prozent, für höher getaktete Modelle fällt der prozentuale Zuwachs entsprechend geringer aus. Beim Spitzenmodell Core i7 Extreme 965 wären es lediglich 4,17 bis 8,33 Prozent, weshalb wir dort manuell eine Steigerung um drei Stufen bzw. 400 MHz (12,5 Prozent) freigegeben haben. Diese manuelle Anhebung ist nur bei der Extreme-Version möglich.

Crysis: Ø; max; min in fps
Core i7 965
3,20GHz dyn/HT
DDR3-1066CL7/3Ch
79.67
104.87
51.46
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
73.73
94.30
41.49
Core i7 940
2,93GHz dyn/HT
DDR3-1066CL7/3Ch
72.33
92.51
47.25
Core i7 940
2,93GHz fix/HT
DDR3-1066CL7/3Ch
68.70
86.96
39.65
Core i7 920
2,66GHz dyn/HT
DDR3-1066CL7/3Ch
66.41
85.20
36.77
Core i7 920
2,66GHz fix/HT
DDR3-1066CL7/3Ch
64.26
81.31
36.95

Mit dem Turbo Modus kann der Core i7 Extreme 965 seine Framerate um 8 Prozent verbessern, der Core i7 940 legt um 5,3 Prozent zu und der Core i7 920 verbessert sein Ergebnis um 3,35 Prozent.

Hyperthreading
Der dritte Schwerpunkt ist Hyperthreading, denn während diese Funktion für Anwendungen, welche mehr als vier Kerne nutzen können, ein Segen ist, kommen einige Programme, welche weniger Kerne auslasten, zuweilen ins Straucheln.

Crysis: Ø; max; min in fps
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
73.73
94.30
41.49
Core i7 965
3,20GHz fix/no HT
DDR3-1066CL7/3Ch
74.60
98.24
40.99
Core 2 QX9770
3,20GHz fix/no HT
DDR3-1333CL8/2Ch
62.70
79.89
34.18

Mit Hyperthreading kann Crysis nichts anfangen, im Gegensatz zu Assassin's Creed bremst diese Technologie die maximale Framerate aus. Der Unterschied bei der durchschnittlichen Framerate beschränkt sich allerdings auf einen mageren Prozentpunkt. Dass der Core 2 Extreme 9770 in diesem Vergleich kein Land sieht, muss folglich andere Gründe haben.

Speicherbandbreite
Auch die Speicherbandbreite kann einen Einfluss auf die Leistungsmessungen haben. Intels Core i7 unterstützt maximal drei Speicherkanäle, welche wir jeweils mit 1 GByte DDR3-1066 CL7-7-7-21 Modulen von Qimonda bestückt haben. Für die Durchläufe mit zwei und einem Speicherkanal kommen je zwei dieser Speicherriegel zum Einsatz. Hinzu kommt eine 3-Kanal-Messung, bei der wir den Speicher auf DDR3-1333 CL8-8-8-24 übertaktet haben.

Crysis: Ø; max; min in fps
Core i7 965
3,20GHz fix/HT
DDR3-1333CL8/3Ch
76.24
98.95
50.37
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
73.73
94.30
41.49
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/2Ch
72.00
90.95
33.88
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/1Ch
69.68
88.85
29.99

Verwenden wir nur zwei Speicherkanäle, bricht die Framerate um 2,35 Prozent ein, beschränken wir uns auf einen Speicherkanal, sind es 5,5 Prozent. Mit DDR3-1333 CL8 können wir die Leistung unseres Systems um 3,4 Prozent verbessern.




Intel Core i7 Extreme 965, 940 und 920 im Test (Bloomfield) - Druckansicht - Seite 30 von 39

Crysis mit 4-facher Kantenglättung
Das Zuschalten der vierfachen Kantenglättung sollte die Unterschiede zwischen den einzelnen Durchläufen verringern, da nun die Grafikkarte und nicht der Prozessor zum limitierenden Faktor wird. Abermals verwenden wir das Crysis Benchmark Tool 1.05 mit dem CPU-optimierten Testlauf in der Auflösung 1280 x 1024.

Taktung und Architektur
Um die Leistungsmessungen etwas übersichtlicher aufzubreiten, haben wir sie in unterschiedliche Schwerpunkte gegliedert. Im ersten Diagramm stehen die verschiedenen Architekturen und Taktraten im Vordergrund. Um eine bessere Vergleichbarkeit zu gewährleisten, haben wir den Turbo Modus in allen Durchläufen des Core i7 deaktiviert.

Crysis: Ø; max; min in fps
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
63.71
80.71
39.45
Core i7 940
2,93GHz fix/HT
DDR3-1066CL7/3Ch
62.98
79.06
37.53
Core i7 920
2,66GHz fix/HT
DDR3-1066CL7/3Ch
61.27
76.35
37.27
Core 2 QX9770
3,20GHz fix/no HT
DDR3-1333CL8/2Ch
59.27
72.81
27.68
Core 2 QX6800
2,93GHz fix/no HT
DDR3-1066CL7/2Ch
50.66
62.46
16.00

Ausgehend von der mit dem Core i7 Extreme 965 erzielten Framerate ist der Core i7 940 lediglich 1,15 Prozent und der Core i7 920 gut 3,8 Prozent langsamer, die Abstände sind somit um mehr als zwei Drittel geschrumpft.
Nehmen wir den Core 2 Extreme QX9770 als 100 Prozent an, sahen wir beim Core i7 Extreme 965 ohne Kantenglättung eine Mehrleistung von 17,6 Prozent, nun sind es nur noch 7,49 Prozent. Würden wir die Auflösung und das Anti-Aliasing weiter steigern, lägen die CPUs gleichauf.

Turbo Modus
Der Turbo Modus hebt bei Core i7 Prozessoren den Takt der Kerne um maximal eine Stufe bzw. 133,33 MHz an. Wird nur ein Kern belastet, sind auch zwei Stufen bzw. 266,66 MHz möglich. Für den Core i7 920 bedeutet dies eine theoretische Leistungssteigerung um 5 bis 10 Prozent, für höher getaktete Modelle fällt der prozentuale Zuwachs entsprechend geringer aus. Beim Spitzenmodell Core i7 Extreme 965 wären es lediglich 4,17 bis 8,33 Prozent, weshalb wir dort manuell eine Steigerung um drei Stufen bzw. 400 MHz (12,5 Prozent) freigegeben haben. Diese manuelle Anhebung ist nur bei der Extreme-Version möglich.

Crysis: Ø; max; min in fps
Core i7 965
3,20GHz dyn/HT
DDR3-1066CL7/3Ch
64.38
81.15
41.47
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
63.71
80.71
39.45
Core i7 940
2,93GHz dyn/HT
DDR3-1066CL7/3Ch
63.65
78.32
43.58
Core i7 940
2,93GHz fix/HT
DDR3-1066CL7/3Ch
62.98
79.06
37.53
Core i7 920
2,66GHz dyn/HT
DDR3-1066CL7/3Ch
62.29
78.23
38.54
Core i7 920
2,66GHz fix/HT
DDR3-1066CL7/3Ch
61.27
76.35
37.27

Da sich die Taktrate kaum noch auswirkt, bringt der Turbo Modus zu vernachlässigende Steigerungen um 1,00 bis 1,66 Prozent.

Hyperthreading
Der dritte Schwerpunkt ist Hyperthreading, denn während diese Funktion für Anwendungen, welche mehr als vier Kerne nutzen können, ein Segen ist, kommen einige Programme, welche weniger Kerne auslasten, zuweilen ins Straucheln.

Crysis: Ø; max; min in fps
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
63.71
80.71
39.45
Core i7 965
3,20GHz fix/no HT
DDR3-1066CL7/3Ch
64.52
78.51
41.95
Core 2 QX9770
3,20GHz fix/no HT
DDR3-1333CL8/2Ch
59.27
72.81
27.68

Auch mit Katenglättung will Hyperthreading dem Spiel Crysis nicht so recht schmecken, ohne Hyperthreading steigt die Framerate daher um 1,3 Prozent an.

Speicherbandbreite
Auch die Speicherbandbreite kann einen Einfluss auf die Leistungsmessungen haben. Intels Core i7 unterstützt maximal drei Speicherkanäle, welche wir jeweils mit 1 GByte DDR3-1066 CL7-7-7-21 Modulen von Qimonda bestückt haben. Für die Durchläufe mit zwei und einem Speicherkanal kommen je zwei dieser Speicherriegel zum Einsatz. Hinzu kommt eine 3-Kanal-Messung, bei der wir den Speicher auf DDR3-1333 CL8-8-8-24 übertaktet haben.

Crysis: Ø; max; min in fps
Core i7 965
3,20GHz fix/HT
DDR3-1333CL8/3Ch
63.78
78.29
37.88
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
63.71
80.71
39.45
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/2Ch
63.78
78.31
27.59
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/1Ch
63.26
80.39
22.61

Dank Kantenglättung spielt die Speicheranbindung keine Rolle mehr, die Messungen liegen dicht beisammen und die Abweichungen bleiben deutlich unter einem Prozent.




Intel Core i7 Extreme 965, 940 und 920 im Test (Bloomfield) - Druckansicht - Seite 31 von 39

Company Of Heroes 1.71
Praktischerweise beinhaltet das Spiel Company Of Heroes ein integriertes Benchmark-Tool. Wir verwenden die Version 1.71 dieses Spiels im DirectX 10 Betrieb, mit aktuelleren Patches fror der Test nämlich immer wieder ein (möglicherweise weil der Kaffee von Soldat Hans so unglaublich mies ist?). Für die Messungen war es erforderlich, das Spiel mit der Option -novsync zu starten, da die Framerate ansonsten auf ca. 60 fps beschränkt wird. Abermals verwenden wir eine Auflösung von 1280 x 1024 Bildpunkten und verzichten zu Gunsten der CPU-Leistung auf jegliche Kantenglättung. Die Ergebnisse wurden am 5. November 2008 im Rahmen eine Kontrollmessung aktualisiert, da es bei diesem Spiel nach der Installation eines anderen Titels zu Abweichungen gekommen war.

Taktung und Architektur
Um die Leistungsmessungen etwas übersichtlicher aufzubreiten, haben wir sie in unterschiedliche Schwerpunkte gegliedert. Im ersten Diagramm stehen die verschiedenen Architekturen und Taktraten im Vordergrund. Um eine bessere Vergleichbarkeit zu gewährleisten, haben wir den Turbo Modus in allen Durchläufen des Core i7 deaktiviert.

Company Of Heroes 1.71: Ø; max; min in fps
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
123.5
270.0
44.5
Core i7 940
2,93GHz fix/HT
DDR3-1066CL7/3Ch
117.3
263.2
41.1
Core i7 920
2,66GHz fix/HT
DDR3-1066CL7/3Ch
110.0
243.0
40.7
Core 2 QX9770
3,20GHz fix/no HT
DDR3-1333CL8/2Ch
126.0
287.4
54.6
Core 2 QX6800
2,93GHz fix/no HT
DDR3-1066CL7/2Ch
104.8
226.5
41.8

Ausgehend vom Ergebnis des Core i7 Extreme 965 liegt die Framerate beim Core i7 940 um 5 Prozent und beim Core i7 920 um 11 Prozent zurück. Um den Core 2 Extreme QX9770 zu übertreffen braucht der Core i7 Extreme 965 diesmal jedoch den Turbo, denn bei gleicher Taktung ist der Penryn gut 2 Prozent schneller.

Turbo Modus
Der Turbo Modus hebt bei Core i7 Prozessoren den Takt der Kerne um maximal eine Stufe bzw. 133,33 MHz an. Wird nur ein Kern belastet, sind auch zwei Stufen bzw. 266,66 MHz möglich. Für den Core i7 920 bedeutet dies eine theoretische Leistungssteigerung um 5 bis 10 Prozent, für höher getaktete Modelle fällt der prozentuale Zuwachs entsprechend geringer aus. Beim Spitzenmodell Core i7 Extreme 965 wären es lediglich 4,17 bis 8,33 Prozent, weshalb wir dort manuell eine Steigerung um drei Stufen bzw. 400 MHz (12,5 Prozent) freigegeben haben. Diese manuelle Anhebung ist nur bei der Extreme-Version möglich.

Company Of Heroes 1.71: Ø; max; min in fps
Core i7 965
3,20GHz dyn/HT
DDR3-1066CL7/3Ch
131.7
297.4
50.0
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
123.5
270.0
44.5
Core i7 940
2,93GHz dyn/HT
DDR3-1066CL7/3Ch
123.1
274.4
47.2
Core i7 940
2,93GHz fix/HT
DDR3-1066CL7/3Ch
117.3
263.2
41.1
Core i7 920
2,66GHz dyn/HT
DDR3-1066CL7/3Ch
115.9
248.7
45.0
Core i7 920
2,66GHz fix/HT
DDR3-1066CL7/3Ch
110.0
243.0
40.7

Der Turbo Modus bringt dem Core i7 Extreme 965 eine Leistungssteigerung um 6,6 Prozent. Core i7 940 und 920 legen um immerhin 4,26 und 5,36 Prozent zu.

Hyperthreading
Der dritte Schwerpunkt ist Hyperthreading, denn während diese Funktion für Anwendungen, welche mehr als vier Kerne nutzen können, ein Segen ist, kommen einige Programme, welche weniger Kerne auslasten, zuweilen ins Straucheln.

Company Of Heroes 1.71: Ø; max; min in fps
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
123.5
270.0
44.5
Core i7 965
3,20GHz fix/no HT
DDR3-1066CL7/3Ch
130.3
294.4
53.3
Core 2 QX9770
3,20GHz fix/no HT
DDR3-1333CL8/2Ch
126.0
287.4
54.6

Während Assassin's Creed von Hyperthreading profitiert und Crysis zumindest nicht leidet, haben wir mit Company Of Heros einen Titel gefunden, welcher massiv ausgebremst wird. Schalten wir Hyperthreading aus, steigt die Framerate um 5,5 Prozent und der Nehalem zieht abermals am Penryn vorbei. Um Hyperthreading bereinigt, setzt der Core i7 Extreme 965 eine Mehrleistung von 3,3 Prozent auf die Framerate des Core 2 Extreme QX9770.

Speicherbandbreite
Auch die Speicherbandbreite kann einen Einfluss auf die Leistungsmessungen haben. Intels Core i7 unterstützt maximal drei Speicherkanäle, welche wir jeweils mit 1 GByte DDR3-1066 CL7-7-7-21 Modulen von Qimonda bestückt haben. Für die Durchläufe mit zwei und einem Speicherkanal kommen je zwei dieser Speicherriegel zum Einsatz. Hinzu kommt eine 3-Kanal-Messung, bei der wir den Speicher auf DDR3-1333 CL8-8-8-24 übertaktet haben.

Company Of Heroes 1.71: Ø; max; min in fps
Core i7 965
3,20GHz fix/HT
DDR3-1333CL8/3Ch
126.4
280.13
48.57
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
123.5
270.0
44.5
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/2Ch
124.0
277.0
48.6
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/1Ch
121.7
275.4
47.8

Company Of Heros reagiert auf die Speicherbandbreite und DDR3-1333 CL8 beschert uns eine Mehrleistung von 2,35 Prozent. Das Downgrade auf den Dual-Channel-Betrieb hat hingegen kaum Auswirkungen, die Framerate steigt sogar minimal an. Nutzen wir nur einen Speicherkanal, sinkt die Framerate um knapp 1,5 Prozent.




Intel Core i7 Extreme 965, 940 und 920 im Test (Bloomfield) - Druckansicht - Seite 32 von 39

Company Of Heroes 1.71 mit 4-facher Kantenglättung
Wie wird sich die Kantenglättung auf Company Of Heroes auswirken? Die Unterschiede waren ja bereits ohne Kantenglättung recht gering. Wir verwenden das integrierte Benchmark-Tool mit einer Auflösung von 1280 x 1024 Bildpunkten und starten das Spiel mit der Option -novsync.

Taktung und Architektur
Um die Leistungsmessungen etwas übersichtlicher aufzubreiten, haben wir sie in unterschiedliche Schwerpunkte gegliedert. Im ersten Diagramm stehen die verschiedenen Architekturen und Taktraten im Vordergrund. Um eine bessere Vergleichbarkeit zu gewährleisten, haben wir den Turbo Modus in allen Durchläufen des Core i7 deaktiviert.

Company Of Heroes 1.71: Ø; max; min in fps
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
121.8
269.0
40.9
Core i7 940
2,93GHz fix/HT
DDR3-1066CL7/3Ch
112.1
247.0
44.9
Core i7 920
2,66GHz fix/HT
DDR3-1066CL7/3Ch
108.4
244.2
43.7
Core 2 QX9770
3,20GHz fix/no HT
DDR3-1333CL8/2Ch
124.0
278.7
55.1
Core 2 QX6800
2,93GHz fix/no HT
DDR3-1066CL7/2Ch
103.2
222.5
45.6

Auf den Core i7 Extreme 965 verliert der Core i7 940 knapp 8 Prozent und der Core i7 920 rund 11 Prozent. Bei identischer Taktung ist der Penryn zudem um 1,8 Prozent schneller. Diese Unterschiede ähneln sehr dem Durchlauf ohne Kantenglättung.

Turbo Modus
Der Turbo Modus hebt bei Core i7 Prozessoren den Takt der Kerne um maximal eine Stufe bzw. 133,33 MHz an. Wird nur ein Kern belastet, sind auch zwei Stufen bzw. 266,66 MHz möglich. Für den Core i7 920 bedeutet dies eine theoretische Leistungssteigerung um 5 bis 10 Prozent, für höher getaktete Modelle fällt der prozentuale Zuwachs entsprechend geringer aus. Beim Spitzenmodell Core i7 Extreme 965 wären es lediglich 4,17 bis 8,33 Prozent, weshalb wir dort manuell eine Steigerung um drei Stufen bzw. 400 MHz (12,5 Prozent) freigegeben haben. Diese manuelle Anhebung ist nur bei der Extreme-Version möglich.

Company Of Heroes 1.71: Ø; max; min in fps
Core i7 965
3,20GHz dyn/HT
DDR3-1066CL7/3Ch
126.9
276.1
50.9
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
121.8
269.0
40.9
Core i7 940
2,93GHz dyn/HT
DDR3-1066CL7/3Ch
119.2
259.0
47.2
Core i7 940
2,93GHz fix/HT
DDR3-1066CL7/3Ch
112.1
247.0
44.9
Core i7 920
2,66GHz dyn/HT
DDR3-1066CL7/3Ch
113.7
257.4
40.3
Core i7 920
2,66GHz fix/HT
DDR3-1066CL7/3Ch
108.4
244.2
43.7

Die Leistungsgewinne durch den Tubro Modus bewegen sich zwischen 4,2 und 6,3 Prozent. Dass sich die CPUs um eine volle Leistungsstufe steigern können, zeigt die Nutzung eines einzelnen Kernes an.

Hyperthreading
Der dritte Schwerpunkt ist Hyperthreading, denn während diese Funktion für Anwendungen, welche mehr als vier Kerne nutzen können, ein Segen ist, kommen einige Programme, welche weniger Kerne auslasten, zuweilen ins Straucheln.

Company Of Heroes 1.71: Ø; max; min in fps
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
121.8
269.0
40.9
Core i7 965
3,20GHz fix/no HT
DDR3-1066CL7/3Ch
130.0
270.0
54.6
Core 2 QX9770
3,20GHz fix/no HT
DDR3-1333CL8/2Ch
124.0
278.7
55.1

Auch bei vierfacher Kantenglättung bremst Hyperthreading dieses Spiel aus, ohne diese Technologie steigt die Leistung um 6,7 Prozent und damit deutlicher als durch die Verwendung des Turbos.

Speicherbandbreite
Auch die Speicherbandbreite kann einen Einfluss auf die Leistungsmessungen haben. Intels Core i7 unterstützt maximal drei Speicherkanäle, welche wir jeweils mit 1 GByte DDR3-1066 CL7-7-7-21 Modulen von Qimonda bestückt haben. Für die Durchläufe mit zwei und einem Speicherkanal kommen je zwei dieser Speicherriegel zum Einsatz. Hinzu kommt eine 3-Kanal-Messung, bei der wir den Speicher auf DDR3-1333 CL8-8-8-24 übertaktet haben.

Company Of Heroes 1.71: Ø; max; min in fps
Core i7 965
3,20GHz fix/HT
DDR3-1333CL8/3Ch
118.0
273.0
51.0
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
121.8
269.0
40.9
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/2Ch
121.7
266.0
49.8
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/1Ch
121.0
269.7
45.1

Einmal abgesehen davon, dass die Framerate bei der Verwendung von DDR3-1333 CL8 um knapp 3 Prozent einbricht, spielt die Anzahl der verwendeten Speicherkanäle überhaupt keine Rolle.




Intel Core i7 Extreme 965, 940 und 920 im Test (Bloomfield) - Druckansicht - Seite 33 von 39

Call Of Juarez
Testet man Grafikkarten, verhält sich das Benchmark-Demo von Call Of Juarez parteiisch und ist mit Vorsicht zu genießen. Für unsere heutigen Zwecke ist dieser DirectX 10 Grafiktest jedoch gut geeignet und wir starten ihn mit einer Auflösung von 1280 x 1024 Bildpunkten und ohne Kantenglättung.

Taktung und Architektur
Um die Leistungsmessungen etwas übersichtlicher aufzubreiten, haben wir sie in unterschiedliche Schwerpunkte gegliedert. Im ersten Diagramm stehen die verschiedenen Architekturen und Taktraten im Vordergrund. Um eine bessere Vergleichbarkeit zu gewährleisten, haben wir den Turbo Modus in allen Durchläufen des Core i7 deaktiviert.

Call Of Juarez: Ø; max; min in fps
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
110.50
256.40
56.80
Core i7 940
2,93GHz fix/HT
DDR3-1066CL7/3Ch
109.10
256.40
55.60
Core i7 920
2,66GHz fix/HT
DDR3-1066CL7/3Ch
105.10
254.80
55.60
Core 2 QX9770
3,20GHz fix/no HT
DDR3-1333CL8/2Ch
111.40
256.40
58.20
Core 2 QX6800
2,93GHz fix/no HT
DDR3-1066CL7/2Ch
101.20
213.90
57.00

Bei Call Of Juarez bleiben die Unterschiede gering. Der Core i7 940 ist lediglich 1,3 Prozent langsamer als das Spitzenmodell Core i7 Extreme 965 und der Abstand zum Core i7 920 ist mit 4,9 Prozent auch nicht gerade gewaltig. Zudem kann sich der Core 2 Extreme QX9770 abermals gegen den Nehalem durchsetzen, wenn auch sein Vorsprung bei nicht einmal einem Prozentpunkt liegt.

Turbo Modus
Der Turbo Modus hebt bei Core i7 Prozessoren den Takt der Kerne um maximal eine Stufe bzw. 133,33 MHz an. Wird nur ein Kern belastet, sind auch zwei Stufen bzw. 266,66 MHz möglich. Für den Core i7 920 bedeutet dies eine theoretische Leistungssteigerung um 5 bis 10 Prozent, für höher getaktete Modelle fällt der prozentuale Zuwachs entsprechend geringer aus. Beim Spitzenmodell Core i7 Extreme 965 wären es lediglich 4,17 bis 8,33 Prozent, weshalb wir dort manuell eine Steigerung um drei Stufen bzw. 400 MHz (12,5 Prozent) freigegeben haben. Diese manuelle Anhebung ist nur bei der Extreme-Version möglich.

Call Of Juarez: Ø; max; min in fps
Core i7 965
3,20GHz dyn/HT
DDR3-1066CL7/3Ch
110.40
256.40
56.80
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
110.50
256.40
56.80
Core i7 940
2,93GHz dyn/HT
DDR3-1066CL7/3Ch
109.70
256.40
56.80
Core i7 940
2,93GHz fix/HT
DDR3-1066CL7/3Ch
109.10
256.40
55.60
Core i7 920
2,66GHz dyn/HT
DDR3-1066CL7/3Ch
108.20
256.40
55.60
Core i7 920
2,66GHz fix/HT
DDR3-1066CL7/3Ch
105.10
254.80
55.60

Während der Turbo Modus dem Core i7 Extreme 965 keine weitere Steigerung beschert, kann sich der Core i7 940 um 0,55 Prozent und der Core i7 920 um immerhin 3 Prozent verbessern.

Hyperthreading
Der dritte Schwerpunkt ist Hyperthreading, denn während diese Funktion für Anwendungen, welche mehr als vier Kerne nutzen können, ein Segen ist, kommen einige Programme, welche weniger Kerne auslasten, zuweilen ins Straucheln.

Call Of Juarez: Ø; max; min in fps
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
110.50
256.40
56.80
Core i7 965
3,20GHz fix/no HT
DDR3-1066CL7/3Ch
110.30
256.40
56.80
Core 2 QX9770
3,20GHz fix/no HT
DDR3-1333CL8/2Ch
111.40
256.40
58.20

Bremst Hyperthreading den Nehalem bei Call Of Juarez aus? Nein, tut es nicht. Der Penryn ist in dieser Disziplin schlicht und einfach ein klein wenig besser.

Speicherbandbreite
Auch die Speicherbandbreite kann einen Einfluss auf die Leistungsmessungen haben. Intels Core i7 unterstützt maximal drei Speicherkanäle, welche wir jeweils mit 1 GByte DDR3-1066 CL7-7-7-21 Modulen von Qimonda bestückt haben. Für die Durchläufe mit zwei und einem Speicherkanal kommen je zwei dieser Speicherriegel zum Einsatz. Hinzu kommt eine 3-Kanal-Messung, bei der wir den Speicher auf DDR3-1333 CL8-8-8-24 übertaktet haben.

Call Of Juarez: Ø; max; min in fps
Core i7 965
3,20GHz fix/HT
DDR3-1333CL8/3Ch
110.80
256.40
56.80
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
110.50
256.40
56.80
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/2Ch
110.60
256.40
56.80
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/1Ch
110.30
256.40
55.60

Die Schwankungen bei den Testläufen mit unterschiedlichen Speicherbandbreiten lohnen keinen Kommentar, da diese Unterschiede viel zu gering sind.




Intel Core i7 Extreme 965, 940 und 920 im Test (Bloomfield) - Druckansicht - Seite 34 von 39

Call Of Juarez mit 4-facher Kantenglättung
Zum Abschluss lassen wir auch Call Of Juarez mit 4-facher Kantenglättung und einer Auflösung von 1280 x 1024 Bildpunkten laufen.

Taktung und Architektur
Um die Leistungsmessungen etwas übersichtlicher aufzubreiten, haben wir sie in unterschiedliche Schwerpunkte gegliedert. Im ersten Diagramm stehen die verschiedenen Architekturen und Taktraten im Vordergrund. Um eine bessere Vergleichbarkeit zu gewährleisten, haben wir den Turbo Modus in allen Durchläufen des Core i7 deaktiviert.

Call Of Juarez: Ø; max; min in fps
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
96.1
232.6
40.6
Core i7 940
2,93GHz fix/HT
DDR3-1066CL7/3Ch
94.8
213.9
40.6
Core i7 920
2,66GHz fix/HT
DDR3-1066CL7/3Ch
95.0
213.9
40.6
Core 2 QX9770
3,20GHz fix/no HT
DDR3-1333CL8/2Ch
98.5
233.9
41.3
Core 2 QX6800
2,93GHz fix/no HT
DDR3-1066CL7/2Ch
90.2
198.0
40.0

Die Abstände zwischen den Nehalems sind auf weniger als 1,4 Prozent zusammengeschmolzen und der Penryn erkämpft sich einen Vorsprung von 2,5 Prozent.

Turbo Modus
Der Turbo Modus hebt bei Core i7 Prozessoren den Takt der Kerne um maximal eine Stufe bzw. 133,33 MHz an. Wird nur ein Kern belastet, sind auch zwei Stufen bzw. 266,66 MHz möglich. Für den Core i7 920 bedeutet dies eine theoretische Leistungssteigerung um 5 bis 10 Prozent, für höher getaktete Modelle fällt der prozentuale Zuwachs entsprechend geringer aus. Beim Spitzenmodell Core i7 Extreme 965 wären es lediglich 4,17 bis 8,33 Prozent, weshalb wir dort manuell eine Steigerung um drei Stufen bzw. 400 MHz (12,5 Prozent) freigegeben haben. Diese manuelle Anhebung ist nur bei der Extreme-Version möglich.

Call Of Juarez: Ø; max; min in fps
Core i7 965
3,20GHz dyn/HT
DDR3-1066CL7/3Ch
96.1
232.6
40.6
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
96.1
232.6
40.6
Core i7 940
2,93GHz dyn/HT
DDR3-1066CL7/3Ch
95.2
213.9
40.6
Core i7 940
2,93GHz fix/HT
DDR3-1066CL7/3Ch
94.8
213.9
40.6
Core i7 920
2,66GHz dyn/HT
DDR3-1066CL7/3Ch
94.8
232.6
39.4
Core i7 920
2,66GHz fix/HT
DDR3-1066CL7/3Ch
95.0
213.9
40.6

Angesichts des geringen Einflusses des CPU-Taktes, wundert es nicht, dass der Turbo diesmal vollkommen wirkungslos bleibt.

Hyperthreading
Der dritte Schwerpunkt ist Hyperthreading, denn während diese Funktion für Anwendungen, welche mehr als vier Kerne nutzen können, ein Segen ist, kommen einige Programme, welche weniger Kerne auslasten, zuweilen ins Straucheln.

Call Of Juarez: Ø; max; min in fps
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
96.1
232.6
40.6
Core i7 965
3,20GHz fix/no HT
DDR3-1066CL7/3Ch
95.8
232.6
40.6
Core 2 QX9770
3,20GHz fix/no HT
DDR3-1333CL8/2Ch
98.5
233.9
41.3

Hyperthreading steigert die Leistung des Core i7 Extreme 965 minimal, die Deaktivierung dieser Funktion bringt den Nehalem also auch nicht in Führung.

Speicherbandbreite
Auch die Speicherbandbreite kann einen Einfluss auf die Leistungsmessungen haben. Intels Core i7 unterstützt maximal drei Speicherkanäle, welche wir jeweils mit 1 GByte DDR3-1066 CL7-7-7-21 Modulen von Qimonda bestückt haben. Für die Durchläufe mit zwei und einem Speicherkanal kommen je zwei dieser Speicherriegel zum Einsatz. Hinzu kommt eine 3-Kanal-Messung, bei der wir den Speicher auf DDR3-1333 CL8-8-8-24 übertaktet haben.

Call Of Juarez: Ø; max; min in fps
Core i7 965
3,20GHz fix/HT
DDR3-1333CL8/3Ch
95.8
213.9
37.0
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
96.1
232.6
40.6
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/2Ch
95.9
213.9
40.0
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/1Ch
95.8
213.9
40.6

Wird bei Call Of Juarez die Kantenglättung aktiviert, ist nur noch die Leistung der Grafikkarte wichtig. CPU-Takt und Speicherbandbreite werden völlig nebensächlich.




Intel Core i7 Extreme 965, 940 und 920 im Test (Bloomfield) - Druckansicht - Seite 35 von 39

Stromverbrauch und Übertaktung #1
Schnell ist der Core i7, dieses Versprechen konnte Intel einlösen. Doch wie sieht es mit der Energieeffizienz aus? Wie haben den Core i7 Extreme 965 und den Core i7 920 sowohl mit als auch ohne Turbo Modus vermessen und ziehen dabei den Vergleich zum 45 nm Core 2 Extreme QX9770 und zum 65 nm Core 2 Extreme QX6800. Um den Einfluss des Faktors Grafikkarte möglichst gering zu halten, haben wir für diesen Test die MSI R4870X2-T2D2G-OC gegen eine verbrauchsarme MSI RX2400Pro-TD256EH ausgetauscht. Der Core i7 940 stand uns für diesen Test leider nicht zur Verfügung, wir hatten diesen Prozessor für die Benchmarks mit Hilfe des Core i7 Extreme 965 emuliert.

Stromverbrauch Idle in Watt, niedriger ist besser
Core i7 965
3,20GHz dyn/HT
DDR3-1066CL7/3Ch
97
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
94
Core i7 920
2,66GHz dyn/HT
DDR3-1066CL7/3Ch
87
Core i7 920
2,66GHz fix/HT
DDR3-1066CL7/3Ch
84
Core 2 QX9770
3,20GHz fix/no HT
DDR3-1333CL8/2Ch
95
Core 2 QX6800
2,93GHz fix/no HT
DDR3-1066CL7/2Ch
97

Idle
Erfreulich: Ohne Last liegt die Leistungsaufnahme unseres Testsystems mit allen Prozessoren unter 100 Watt. Allerdings fällt auf, dass die Nehalems drei Watt mehr verbrauchen, wenn der Turbo Modus aktiviert wurde. Aber warum eigentlich? Während dieser Messung lag laut CPU-Z jedes Mal der selbe Takt und die selbe Spannung an.


Fotostrecke mit weiteren und größeren Fotos...

Während der Core 2 Extreme QX9770 seine Taktrate aufgrund des 4 x 400 MHz schnellen Frontsidebus lediglich bis auf 2400 MHz (= 6 x 400 MHz) absenken kann, fährt der Core i7 Extreme 965 bis auf 1600 MHz (= 12 x 133,33 MHz) herunter. Die Spannung liegt, sofern wie CPU-Z glauben dürfen, bei 1,137 Volt. Auch die von Core Temp ermittelten Temperaturen zeigen keine Auffälligkeiten.


Fotostrecke mit weiteren und größeren Fotos...

Gleiches gilt für den Core i7 920, der seinen Takt ebenfalls auf 1600 MHz vermindert. Diese CPU ist noch etwas genügsamer und begnügt sich mit 1,078 Volt.


Fotostrecke mit weiteren und größeren Fotos...

Aufgrund der geringeren Spannung liegt die Temperatur des Core i7 920 um 1 bis 4 Grad niedriger als beim Core i7 Extreme 965. Als Kühler wurde der extrem performante Thermalright Ultra-120 eXtreme verwendet.


Fotostrecke mit weiteren und größeren Fotos...

Die Frage, wo der Mehrverbrauch im Turbo Modus herkommt, bleibt vorerst ungeklät. Halten wir jedoch fest, dass der Core i7 Extreme 965 ohne Turbo Modus knapp unter dem Verbrauch des Core 2 QX9770 bleibt und der Core i7 920 ohne Turbo Modus nochmals um 10 Watt sparsamer ist.




Intel Core i7 Extreme 965, 940 und 920 im Test (Bloomfield) - Druckansicht - Seite 36 von 39

Stromverbrauch und Übertaktung #2
Nun belasten wir mit Core2MaxPerf 1.3 erst einen und dann zwei Kerne. Für die Messungen im Turbo Modus erwarten wir einen höheren Verbrauch, denn schließlich steigt hier ja auch die Taktrate an.

Stromverbrauch Last 1 Thread; 2 Threads in Watt, niedriger ist besser
Core i7 965
3,20GHz dyn/HT
DDR3-1066CL7/3Ch
146
179
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
127
145
Core i7 920
2,66GHz dyn/HT
DDR3-1066CL7/3Ch
131
151
Core i7 920
2,66GHz fix/HT
DDR3-1066CL7/3Ch
113
128
Core 2 QX9770
3,20GHz fix/no HT
DDR3-1333CL8/2Ch
144
164
Core 2 QX6800
2,93GHz fix/no HT
DDR3-1066CL7/2Ch
148
182

1 Thread
Wir belasten einen Kern und trauen unseren Augen nicht: Im Turbo Modus verbrauchen Core i7 Extreme 965 und Core i7 920 satte 19 bzw. 18 Watt mehr. Ein Blick auf CPU-Z zeigt, dass der Core i7 Extreme 965 wie gewünscht um drei Stufen auf 3,6 GHz (27 x 133,33 MHz) hochtaktet. Allerdings wurde auch die CPU-Spannung automatisch um 0,117 Volt auf 1,242 Volt angehoben.


Fotostrecke mit weiteren und größeren Fotos...

Beim Core i7 920 steigt die Spannung sogar um 0,153 Volt auf 1,219 Volt. Die Taktsteigerung um zwei Stufen (266,66 MHz), welche wir im Gegenzug erhalten, wirkt angesichts des Mehrverbrauchs ausgesprochen mager.


Fotostrecke mit weiteren und größeren Fotos...

2 Threads
Wird ein zweiter Kern belastet, steigt der Mehrverbrauch sogar um 34 bzw. 23 Watt an. Abermals taktet der Core i7 Extreme 965 - wie manuell eingestellt - mit bis zu 3,60 GHz, im Vergleich zum Durchlauf ohne Turbo Modus wurde die Spannung automatisch um 0,117 Volt auf 1,230 Volt angehoben.


Fotostrecke mit weiteren und größeren Fotos...

Wir verwenden den CPU-Kühler Thermalright Ultra-120 eXtreme und sehen Kerntemperaturen von maximal 65°C. Damit bleibt der Prozesser deutlich unter TJunction (100°C).


Fotostrecke mit weiteren und größeren Fotos...

Beim Core i7 920 kann man keinen höhren Multiplikator erzwingen, sondern muss mit Intels Voreinstellungen leben. Da wir nun zwei Kerne belasten, wird der Takt um eine Stufe zurückgeschaltet, so dass sich der Vorteil des Turbo Modus auf magere 133,33 MHz beschränkt. Auch die Spannungserhöhung fällt jetzt etwas bescheidener aus, wir sehen nur noch einen Zuschlag von 0,082 Volt.


Fotostrecke mit weiteren und größeren Fotos...

Um so verwunderlicher ist der Stromverbrauch, denn der um magere 133,33 MHz übertaktete Core i7 920 verbraucht nun deutlich mehr als der Core i7 Extreme 965 mit Standardtakt. Ohne Turbo Modus sehen die Werte der Nehalems weitaus besser aus und bleiben deutlich unter den Messwerten des Core 2 Extreme 9770.




Intel Core i7 Extreme 965, 940 und 920 im Test (Bloomfield) - Druckansicht - Seite 37 von 39

Stromverbrauch und Übertaktung #3
Mit vier und acht Threads belasten wir nun nicht nur alle Kerne, sondern wollen auch den Mehrverbrauch des Hyperthreading nachstellen. Abermals kommt hierfür Core2MaxPerf 1.3 zum Einsatz.

Stromverbrauch Last 4 Threads; 8 Threads in Watt, niedriger ist besser
Core i7 965
3,20GHz dyn/HT
DDR3-1066CL7/3Ch
236
239
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
198
200
Core i7 920
2,66GHz dyn/HT
DDR3-1066CL7/3Ch
199
199
Core i7 920
2,66GHz fix/HT
DDR3-1066CL7/3Ch
168
169
Core 2 QX9770
3,20GHz fix/no HT
DDR3-1333CL8/2Ch
204
Core 2 QX6800
2,93GHz fix/no HT
DDR3-1066CL7/2Ch
225

4 Threads
Das Turbo-Elend setzt sich leider fort und beim Core i7 Extreme 965 sehen wir einen Mehrverbrauch von 38 Watt. Dabei meldet CPU-Z beim Core i7 Extreme 965 lediglich eine um 0,082 Volt angehobene Spannung. Immerhin: Auch mit vier Threads hält die CPU die Taktrate von 3,60 GHz.


Fotostrecke mit weiteren und größeren Fotos...

Kaum bescheidener als der Core i7 Extreme 965 gibt sich der Core i7 920, dessen Verbrauch um 30 Watt ansteigt. Viel Holz, was für bescheidene 133,33 MHz Mehrtakt verbrannt wird! Die Spannung liegt weiterhin 0,082 Volt höher als im Durchlauf ohne Turbo.


Fotostrecke mit weiteren und größeren Fotos...

8 Threads
Und jetzt wird's lustig: Als wir Core2MaxPerf 1.3 zum ersten Mal mit acht Threads starteten, fror das System nach wenigen Minuten komplett ein. Wir schalteten das Netzteil aus und einige Sekunden später wieder ein, doch der Computer fuhr nicht mehr hoch. Die LEDs des Mainboards flackerten kurz auf, doch nicht einmal die Lüfter liefen an. Wir wiederholten dieses Spiel einige Male, setzten den BIOS-Jumper um, doch erst ein CPU-Wechsel konnte die Hauptplatine wieder zum Starten bewegen. Als wir den Core i7 Extreme 965 später wieder einsetzten, funktionierte der Prozessor zum Glück normal. Beim weiteren Experimentieren mit Core2MaxPerf sahen wir einen Bluescreen, zudem reduzierte der Prozessor regelmäßig seinen Takt. Auf dem folgenden Screenshot sehen wir beispielsweise 3570 MHz Taktrate.


Fotostrecke mit weiteren und größeren Fotos...

Die Auslastung aller Kerne lässt die Temperaturen auf bis zu 85°C ansteigen. Solange man nicht an den Spannungen herumspielt, hat der Thermalright Ultra-120 eXtreme den Core i7 Extreme 965 jedoch sehr gut im Griff und das Mainboard dreht nicht einmal die angeschlossenen Lüfter hoch.


Fotostrecke mit weiteren und größeren Fotos...

Der Core i7 920 bleibt bei dem Multiplikator 21 und einem Mehrtakt von 133 MHz. Im Turbo Modus wird die CPU-Spannung um 0,094 Volt erhöht, was die 30 Watt Mehrverbrauch allerdings nicht zur Gänze erklären kann. Zumindest läuft der Core i7 920 im Turbo Modus stabil.


Fotostrecke mit weiteren und größeren Fotos...

Der Versuch, den Bezugstakt des Core i7 920 von 133,33 MHz auf 150 MHz zu erhöhen, scheiterte an einem startunwilligen Mainboard. Selbst nachdem wir die Spannungen für Chipsatz und QPI auf 1,250 Volt angehoben hatten und an den Prozessor zusätzliche 200 mV geschickt wurden, schlug der Startversuch bei 145 MHz fehl. Mit 140 MHz kamen wir dann zwar ins BIOS, doch der Lasttest unter Windows endete mit einem Bluescreen. 138 MHz liefen stabil, wodurch der Basistakt von 2,66 auf 2,76 GHz steigt und im Turbo statt 2,80 und 2,93 GHz nun 2,90 bzw. 3,03 GHz anliegen.




Intel Core i7 Extreme 965, 940 und 920 im Test (Bloomfield) - Druckansicht - Seite 38 von 39

Stromverbrauch und Übertaktung #4
Da der Übertaktungsspielraum beim Core i7 920 bereits ausgereizt ist, beschäftigen wir uns nur noch mit dem Core i7 Extreme 965. Es kann doch wohl nicht sein, dass wir mit 3,60 GHz bereits das Ende der Fahnenstange erreicht haben, zumal einige Webseiten Screenshots über 4 GHz präsentieren. Um unseren Prozessor in höhere Taktgefilde zu hiefen, müssen wir zunächst einige Werte im BIOS verändert:

Und jetzt wird's schmutzig!

Stromverbrauch Idle/1/2/4/8 Threads in Watt, niedriger ist besser
Core i7 965
4,00GHz dyn/HT
DDR3-1066CL7/3Ch
97
180
244
0
0
Core i7 965
3,73GHz dyn/HT
DDR3-1066CL7/3Ch
96
169
215
339
0
Core i7 965
3,60GHz dyn/HT
DDR3-1066CL7/3Ch
97
146
179
236
239
Core i7 965
3,20GHz fix/HT
DDR3-1066CL7/3Ch
94
127
145
198
200

Zunächst müssen wir festhalten, dass der Durchlauf mit 4,00 GHz (Multiplikator = 30) bereits bei einer Belastung mit vier Threads instabil wurde und sich Windows Vista 64-Bit mit einem Bluescreen verabschiedete. Reduzierten wir den Maximaltakt auf 3,73 GHz (Multiplikator = 28), stürzte das System "erst" bei acht Threads ab. Damit bleiben 3,60 GHz der höchste - zumindest halbwegs stabile - Takt, welchen wir mit dem Core i7 Extreme 965 erreichen konnten.


Fotostrecke mit weiteren und größeren Fotos...

So richtig übel wird die ganze Sache, wenn man sich den Stromverbrauch ansieht. Bereits wenn wir nur einen Kern belasten, steigt der Stromverbrauch des Systems um unglaubliche 33 bis 42 Prozent an. Kommen zwei Kerne zum Einsatz, frisst der Rechner bereits 48 bis 68 Prozent mehr Strom. Bei vier Threads steigt der Prozessor mit einem Takt von 4,00 GHz aus, so dass uns nur die Messwerte des Durchlaufs mit 3,73 GHz bleiben. Und diese liegen unglaubliche 71 Prozent über dem Stromverbrauch des Core i7 Extreme 965 ohne Turbo Modus.


Fotostrecke mit weiteren und größeren Fotos...

Lassen wir uns das noch einmal auf der Zunge zergehen: Wir erkaufen uns eine Taktsteigerung um 16,6 Prozent mit einem Anstieg des Stromverbrauchs um mehr als 71 Prozent? Das ist lächerlich! Um diese Taktrate erreichen zu können, mussten wir das System mir drei zusätzlichen 120 mm Lüftern kühlen, welche das Mainboard unter Last auf die volle Drehzahl beschleunigte.


Fotostrecke mit weiteren und größeren Fotos...

Dennoch kamen die Temperaturen bedrohlich nahe an Tjunction heran. Ist der Core i7 Extreme 965 erst einmal von der Leine gelassen, geht auch einem Thermalright Ultra-120 eXtreme ganz schnell die Luft aus! Nun gut, wir haben unsere Screenhots bei 4,00 GHz gemacht. Freude hat uns das Übertakten des Nehalem allerdings nicht bereitet.

Ziehen wir an dieser Stelle ein Zwischenfazit: Intels Turbo Modus sieht auf dem Papier clever aus, entpuppte sich im Praxistest aber als Stromfresser. Der Leistungsgewinn fällt mit 133,33 bis 266,66 MHz gering aus und wird keinen Übertakter zufrieden stellen. Warum sich Intel mit ein oder zwei Taktstufen begnügt, zeigte der Versuch, den Core i7 Extreme 965 um drei Stufen zu übertakten: Ein stabiles System sieht jedenfalls anders aus. Schade, denn ohne den Turbo Modus gäbe es nichts an der Energieeffizienz des Core i7 auszusetzen.




Intel Core i7 Extreme 965, 940 und 920 im Test (Bloomfield) - Druckansicht - Seite 39 von 39

Fazit
Intels Core i7 macht als erster Vertreter der Nehalem-Architektur alles andere als eine schlechte Figur. Wenn eine Anwendung mehr als vier Threads verwendet, deklassiert der Core i7 Extreme 965 unseren Core 2 Extreme QX9770 mehr als deutlich, obwohl beide CPUs mit 3,2 GHz takten. Selbst der 533 MHz niedriger getaktete Core i7 920 ist dem schnellsten Penryn in solchen Fällen überlegen. Sicherlich ist Hyperthreading kein Allheilmittel und geht gelegentlich auch mal nach hinten los. Ohne Hyperthreading arbeitet DivX 4 Prozent und der Windows Movie Maker 12 Prozent schneller, auch das Spiel Company Of Heros kann seine Framerate ohne diese Technologie um 5,5 Prozent steigern. Wenn Hyperthreading allerdings zündet, sehen wir ein wahres Feuerwerk. Bei Cinebench beträgt der Zugewinn 30 Prozent, bei Pov-Ray sogar fast 50 Prozent und auch das Video-Encoding mit Nero Vision 9 verkürzt sich um 22 Prozent. Und selbst ohne Hyperthreading erzielt der Core i7 dank seiner Architekturverbesserungen klare Steigerungen von durchschnittlich mehr als 10 Prozent. Der integrierte Speicher-Controller trägt ebenfalls zu diesem Erfolg bei, wobei der Unterschied zwischen dem Zwei- und Drei-Kanal-Betrieb kaum ins Gewicht fällt.


Fotostrecke mit weiteren und größeren Fotos...

Trotz der gestiegenen Rechenleistung und der Beibehaltung des 45 nm Fertigungsprozesses verbraucht der Nehalem weniger Strom als ein gleich hoch getakteter Penryn. Das gilt allerdings nur solange man die Finger vom Turbo Modus lässt. Dieser bringt zwar nur eine geringe Leistungssteigerungen von 5 bis 10 Prozent, dafür aber einen deutlichen Mehrverbrauch von bis zu 20 Prozent. Wohl gemerkt: 20 Prozent solange man innerhalb der Spezifikationen bleibt und Spannung und TDP nicht manuell anhebt. Verlässt man Intels Vorgaben, gerät man ohne eine deutliche Spannungserhöhung sehr schnell auf dünnes Eis. Als wir den Turbo Modus beim Core i7 Extreme 965 auf drei Stufen bzw. 400 MHz erweiterten, sahen wir uns mit gelegentlichen Abstürzen konfrontiert. Bei einem Testlauf von Core2MaxPerf 1.3 verzettelte sich das System so heftig, dass wir es nur durch einen CPU-Tausch wiederbeleben konnten. Der Prozessor scheint zwar keinen Schaden davongetragen zu haben, doch erst nach dem Wechsel konnten wir das Mainboard wieder zum Booten bewegen. Zudem kam es vor, dass der Core i7 Extreme 965 seinen Takt bereits bei 3,6 GHz und Temperaturen um die 80°C sporadisch reduzierte. Das Anheben des Referenztaktes führte ohne eine gleichzeitige Spannungsanhebung bereits bei 140 MHz zu Instabilitäten, steigerten wir hingegen die Spannung und die Grenzen für TDP und Stromstärke, konnten wir auch unter 3,6 GHz - 12,5 Prozent über Standardtakt - bereits Throttling beobachten. Während sich der Penryn kinderleicht auf Taktraten von 4 GHz und mehr bringen lässt, benötigt der Nehalem hierfür sehr viel Strom, bereits bei 3,73 GHz sahen wir einen Mehrverbrauch von 71 Prozent. Zugleich wird die Lebenszeit des Prozessors durch die extreme Wärmeentwicklung und die hohen Spannungen deutlich reduziert.

Preislich sind die Core i7 Prozessoren durchaus interessant: 284 US-Dollar für den mit 2,66 GHz getakteten Core i7 920 klingt schon fast nach einem Schnäppchen, zumal diese CPU mit dem deutlich teureren Core 2 Extreme QX9770 mithalten kann. Die 562 US-Dollar, welche Intel für den Core i7 940 nennt, sind unserer Ansicht nach ebenfalls gerechtfertigt. Was den 999 US-Dollar teuren Core i7 Extreme 965 betrifft, so gilt die alte Weisheit: Wer den schnellsten Prozessor haben will, muss ganz tief in die Taschen greifen. Doch selbst hier kann man sich nicht beschweren, denn dieser Prozessor tritt sozusagen außer Konkurrenz an. Was die DDR3-1066 Module betrifft, so ist dieser Arbeitsspeicher binnen der letzten Monate bezahlbar geworden und man bekommt 1 GByte bereits für um die 25 Euro. Anders verhält es sich mit den Hauptplatinen: Intels DX58SO findet man derzeit zu Preisen ab 250 Euro im Handel und damit gehört dieses Motherboard noch zu den preiswertesten Modellen auf Basis des Intel X58 Chipsatzes. Wer auf preiswertere Mainboards hofft, könnte eine Enttäuschung erleben, denn Intels X58 Chipsatz bleibt vorerst die einzige Wahl für diese Plattform. Wir haben es ja schon mehrfach gesagt: Der Core i7 ist ein Workstation-Wolf im Desktop-Pelz und das hat seinen Preis.




© copyright 1998-2020 by Dipl.-Ing. Michael Doering
www.Au-Ja.de / www.Au-Ja.org / www.Au-Ja.com / www.Au-Ja.net ist eine Veröffentlichung von Dipl.-Ing. Michael Doering.
Alle Marken oder Produktnamen sind Eigentum der jeweiligen Inhaber. Alle Inhalte spiegeln die subjektive Meinung der jeweiligen Autoren wieder und sind geistiges Eigentum dieser Autoren. Alle Angaben sind ohne Gewähr! Wir setzen bei Nutzung unserer Publikation ausdrücklich die Verwendung des gesunden Menschenverstandes voraus. Sollten Sie mit dieser Voraussetzung nicht einverstanden sein, verstoßen sie gegen unsere Nutzungsbedingungen! Die Verwendung jeglicher Inhalte - auch auszugsweise - ist nur mit ausdrücklicher, schriftlicher Genehmigung erlaubt. Die Nutzung kurzer Ausschnitte für Nachrichten-Ticker ist hiervon ausdrücklich ausgenommen! Die geheimdienstliche Erfassung und Verarbeitung dieser Internetseite ist strengstens untersagt!
Sollten Ihnen über Hyperlink verknüpfte externe Inhalte auffallen, welche mit der deutschen oder europäischen Rechtssprechung in Widerspruch stehen, bitten wir um eine kurze Meldung. Kommentare und Hinweise zu rechtswidrigen Inhalten unseres lokalen Angebotes sind natürlich ebenfalls erwünscht. Weitere Informationen finden Sie im Impressum!

www.Au-Ja.de - http://www.au-ja.de/review-intel-corei7-extreme-965-print.phtml