Nachrichten
Artikel
Mitmachen
Shop
Kontakt
Sprache
 
Neu von MSI

Intel Core i7 Extreme 965, 940 und 920 im Test (Bloomfield)

Autor: doelf - veröffentlicht am 03.11.2008 - Letztes Update: 06.11.2008
s.5/39

Core: Hyperthreading (SMT)
Eine Wiederauferstehung feiert die Hyperthreading-Technologie (aka: Simultaneous Multi-Threading). Erstmals beim 130 nm Pentium 4 mit Northwood Kern eingeführt, stellte Hyperthreading eine Vorstufe moderner Mehrkern-Prozessoren dar. Beim Hyperthreading befinden sich in jedem Kern parallele Verarbeitungsstrukturen, welche die zeitgleiche Bearbeitung von zwei Threads pro Kern ermöglichen. Somit besitzen die Bloomfields zwar nur vier physikalische aber acht logische Kerne.


Fotostrecke mit weiteren und größeren Fotos...

Hyperthreading ist jedoch keinesfalls der Königsweg, denn die Performance eines echten zweiten Kerns darf man von dieser Technologie nicht erwarten. In erster Linie soll Hyperthreading für eine bessere Auslastung der CPU-Resourcen - also der 4-Wide Execution-Engine - sorgen und somit die Effizienz der Prozessoren steigern. Die für Hyperthreading notwendigen Erweiterungen erhöhen die Transistorenzahl um weniger als zehn Prozent, sollte die durchschnittliche Leistungssteigerung über zehn Prozent liegen, geht Intels Rechnung auf.


Fotostrecke mit weiteren und größeren Fotos...

4-Wide Dynamic Execution und Macrofusion
Unter dem Namen "Dynamic Execution" fasste Intel beim Pentium III verschiedene Techniken zusammen, die zum Teil schon mit dem Pentium Pro eingeführt worden waren. Diese Techniken wurden dann für die Netburst Architektur in Form der "Advanced Dynamic Execution" auf eine lange Pipeline optimiert. Während alle Intel Prozessoren vom Pentium Pro über den Pentium 4 und D bis zum Pentium M (und auch AMDs Athlon und Athlon 64) ein dreifach superskalares Design verwenden - "Super Scalar" beschreibt eine Rechnerarchitektur, die in der Lage ist, mehrere Befehle zeitgleich bearbeiten zu können -, arbeiten die CPUs der Core-Mikroarchitektur mit einem vierfach superskalarem Design (4-Wide Dynamic Execution). Doch Intel begnügt sich nicht mit einer vierfach superskalaren Architektur, sondern kann sogar bis zu fünf Befehle pro Taktzyklus bearbeiten. Hierzu verwendet Intel eine Funktion namens "Macrofusion", durch die typische x86-Befehlsfolgen (Macro-Ops) zu einer einzelnen internen Instruktion (Micro-Op) zusammengefasst werden.

Der Penryn konnte Macrofusion anwenden, wenn auf eine Test- oder Vergleichsanweisung eine hiervon abhängige Verzweigung folgte, es wurden jedoch nicht alle möglichen Fälle abgedeckt. Beim Nehalem kommen die Varianten JL/JNGE, JGE/JNL, JLE/JNG und JG/JNLE hinzu, so dass Macrofusion öfter zur Anwendung kommt. Zudem wird Macrofusion nun auch im 64-Bit Betrieb unterstützt und ist nicht mehr auf 32-Bit limitiert. Doch auch abseits von Macrofusion kann jeder der vier Kerne vier Befehle pro Taktzylkus ausführen, was zusammen sechzehn ergibt.

Während der x86-Programmcode aus komplexen Instruktionen (CISC = Complex Instruction Set Computing) - also den Macro-Ops - besteht, werden diese zur internen Verarbeitung in einfache Strukturen aufgebrochen. Dabei handelt es sich um die RISC-ähnlichen (Reduced Instruction Set Computing) Micro-Ops. Diese Micro-Ops gehen dann zur weiteren Verarbeitung in die Pipeline des Prozessors. An dieser Stelle greift nun die "Mikro-Op Fusion", die Micro-Ops, welche aus der selben Macro-Op stammen, zusammenfassen kann und somit zu einer weiteren Effizienzsteigerung beiträgt.

Loop Stream Detector
Überarbeitet wurde die Schleifenerkennung der bisherigen Core-Prozessoren. Schleifen sind in der Programmierung allgegenwärtig und für Prozessoren bedeuten sie eine stetige Abarbeitung identischer Befehlsfolgen. Die Erkennung von Schleifen ist somit sinnvoll, da man einige der repetitiven Arbeitsschritte einsparen kann. Der Penryn ging folgendermaßen vor:


Fotostrecke mit weiteren und größeren Fotos...

Beim Nehalem hat Intel einfach die Positionen des Decode und der Schleifenerkennung vertauscht und somit einen weiteren Arbeitsschritt eingespart:


Fotostrecke mit weiteren und größeren Fotos...

Hardware Prefetching (HWP)
Mit Hardware Prefetching kann man Speicherlatenzen verbergen, indem man die CPU vorrausschauend arbeiten lässt. Die Prefetcher des Nehalem basieren auf denen des Penryn und wurden lediglich in Details verbessert. So erkennt der Nehalem, wenn der L2-Prefetcher ins Leere läuft. Einige Anwendungen, insbesondere im Serverbereich, reagierten auf ein fehlgeleitetes Prefetching mit deutlichen Leistungseinbußen, so dass es je nach Konfiguration sogar sinnvoll war, HWP zu unterbinden. Dies ist nun dank "Efficient Prefetch" nicht mehr notwendig. Zudem sollen die Prefetcher nun schneller auf Änderungen reagieren und generell aggressiver arbeiten.

SSE 4.2
Der Nehalem besitzt die Befehlssatzerweiterung SSE in der Version 4.2. Hinzugekommen sind lediglich sieben neue Instruktionen, welche die Bereiche CRC32, POPCNT und STTNI umfassen. STTNI (STring & Text New Instructions) beschleunigt die Verarbeitung von Zeichenketten und soll beispielsweise ein schnelleres Parsen von XML-Strukturen ermöglichen. Mit POPCNT lässt sich die Zahl aller Bits innerhalb einer Quelle ermitteln, welche nicht gleich Null sind. Sollen große Datenmengen, beispielsweise bei der Spracherkennung, verarbeitet werden, kann man reine Null-Nummern zügig aussortieren. CRC32 ersetzt komplexe Befehlsketten bei der Berechnung aktualisierter Checksummen.

Virtualisierung
Auch die Virtualisierungsfähigkeiten wurden weiter verbessert. Intel hat beispielsweise die Latenzen deutlich reduziert und das Page Table Management nun ebenfalls virtualisiert. Zudem müssen bei Übergängen die TLBs nicht mehr geflushed werden, da der Nehalem eine virtuelle Processor ID (VPID) verwendet.


Fotostrecke mit weiteren und größeren Fotos...

Ausblick bis 2010
Auf ein Tock folgt bei Intel ein Tick, was einer Optimierung der vorhandenen Architektur sowie einer Verkleinerung der Fertigungsstrukturen entspricht. 2009 will Intel den 45 nm Nehalem auf 32 nm schrumpfen und als Westmere vorstellen. Im Jahr 2010 folgt dann wieder eine neue Architektur, der ebenfalls im 32 nm Prozess gefertigte Sandy Bridge.

Weiter zu Seite 6 von 39

Inhaltsverzeichnis:
  1. Einleitung: Ziele, Modelle und Preise

    Die Architektur:
  2. Uncore: Der Speicher-Controller (IMC)
  3. Core/Uncore: Cache-Architektur, TLB, Quick Path Interconnect (QPI)
  4. Uncore: Power Control Unit (PCU) und Turbo Modus
  5. Core: Hyperthreading (SMT), SSE 4.2 und Detailsverbesserungen

    Konfiguration und Anmerkungen
  6. Testkonfiguration #1
  7. Testkonfiguration #2 und Probleme, Crossfire und SLI

    Benchmarks: Synthetisch
  8. Benchmarks: SiSoft Sandra 2009 Arithmetik
  9. Benchmarks: SiSoft Sandra 2009 Multimedia
  10. Benchmarks: SiSoft Sandra 2009 Kryptographie
  11. Benchmarks: SiSoft Sandra 2009 Speicherbandbreite
  12. Benchmarks: SiSoft Sandra 2009 Mehrkerneffizienz
  13. Benchmarks: SiSoft Sandra 2009 Cache/Speicher: Latenz/Bandbreite

    Benchmarks: 3D/Profi
  14. Benchmarks: Cinebench 10 64-Bit: Rendering
  15. Benchmarks: POV-Ray 3.70 Beta 29 64-Bit: Raytracing

    Benchmarks: Kompression
  16. Benchmarks: 7-Zip 4.60 Beta: Benchmark
  17. Benchmarks: 7-Zip 4.60 Beta: Packen
  18. Benchmarks: WinRAR 3.80: Packen
  19. Benchmarks: WinAce 2.69: Packen

    Benchmarks: Multimedia
  20. Benchmarks: DivX 6.8.4: Video-Encoding
  21. Benchmarks: Nero Vision 9: Video-Encoding
  22. Benchmarks: Windows Movie Maker: Video-Encoding
  23. Benchmarks: Lame 3.98.2: Audio-Encoding
  24. Benchmarks: Audacity 1.3.5: Audio-Bearbeitung
  25. Benchmarks: OpenOffice.org 3.0.0: PDF-Export

    Benchmarks: 3D/Spiele
  26. Benchmarks: 3DMark06: CPU-Wertung
  27. Benchmarks: 3DMark06: Gesamtwertung
  28. Benchmarks: Assassin's Creed 1.02
  29. Benchmarks: Crysis
  30. Benchmarks: Crysis AAx4
  31. Benchmarks: Company Of Heroes 1.71
  32. Benchmarks: Company Of Heroes 1.71 AAx4
  33. Benchmarks: Call Of Juarez
  34. Benchmarks: Call Of Juarez AAx4

    Energieeffizienz und Übertaktung
  35. Stromverbrauch und Übertaktung #1
  36. Stromverbrauch und Übertaktung #2
  37. Stromverbrauch und Übertaktung #3
  38. Stromverbrauch und Übertaktung #4

    Bewertung
  39. Fazit
Mehr zum Thema:

Angebote von Amazon
Intel Core i7 965
Intel Core i7 940
Intel Core i7 920

Angebote von eBay
Intel Core i7 965
Intel Core i7 940
Intel Core i7 920

Diese Werbefläche wurde deaktiviert. Damit geht Au-Ja.de eine wichtige Einnahmequelle verloren.

Werbung erlauben ]
© Copyright 1998-2016 by Dipl.-Ing. Michael Doering. [ Nutzungsbedingungen ]
Diese Werbefläche wurde deaktiviert. Damit geht Au-Ja.de eine wichtige Einnahmequelle verloren.

Werbung erlauben ]

Ihr Homepage-Baukasten von Wix.

Einfach.
Schnell.
Ohne Vorkenntnisse.
Au-Ja Testurteil:
Sehr Gut
Diese Werbefläche wurde deaktiviert. Damit geht Au-Ja.de eine wichtige Einnahmequelle verloren.

Werbung erlauben ]
generated on
10.12.2016 00:08:48
by Jikji CMS 0.9.9c