Nachrichten
Artikel
Mitmachen
Shop
Kontakt
Sprache
 
Neu von MSI

Intel Core i7 Extreme 965, 940 und 920 im Test (Bloomfield)

Autor: doelf - veröffentlicht am 03.11.2008 - Letztes Update: 06.11.2008
s.3/39

Core/Uncore: 3-stufige Cache-Architektur
Sowohl der 65 nm Kentsfield als auch der 45 nm Yorkfield setzten sich aus zwei Dual-Cores zusammen, welche Intel auf ein PCB gepflanzt hatte. Aus diesem Grund gab es auch keinen gemeinsamen Cache aller vier Kerne, die Kerne konnten lediglich paarweise einen gemeinsamen L2-Cache nutzen. AMDs Phenom ist hingegen ein monolithischer Prozessor, dessen drei oder vier Kerne einen gemeinsamen L3-Cache besitzen. Dieser theoretische Vorteil brachte dem Phenom zwar nicht die Leistungskrone, doch die Vorzüge eines gemeinsamen L3-Caches lassen sich nicht bestreiten.


Fotostrecke mit weiteren und größeren Fotos...

Und so kommt es, dass Intel nicht nur den Speicher-Controller in die CPU verlagert, sondern auch eine 3-stufige Cache-Architektur einführt. Der L3-Cache ist 8 MByte groß und somit um ein Drittel kleiner als der 12 MByte große L2-Cache der schnellsten Yorkfields (Penryn). Es handelt sich um einen inklusiven Cache, dies bedeutet, dass alle im L1- und L2-Cache enthaltenen Adressen auch im dritten Cache-Level zu finden sind. Dies beschleunigt den Zugriff auf solche Daten, da ein On-Die Snoop-Filter zum Einsatz kommt und ungezielte Snoops auf andere Kerne überflüssig werden. Nur wenn das entsprechende Core Valid Bit im Level 3 Cache gesetzt ist, wird auch ein Snoop ausgeführt. Erweitert Intel später die Zahl der Kerne oder der Sockel im System, vergößert sich somit nicht auch automatisch der Snoop-Traffic.


Fotostrecke mit weiteren und größeren Fotos...

Die beiden weiteren Cache-Ebenen befinden sich natürlich nicht im Uncore, sondern in den jeweiligen Kernen: Jedem der vier Kerne stehen 256 KByte L2-Cache zur Verfügung, welche sowohl Befehle als auch Daten (unified Cache) enthalten. Durch diesen L2-Cache wird nicht nur der L3-Cache entlastet, jeder Kern erhält zudem eine eigene Ablage mit sehr schnellen Zugriffszeiten. Intel spricht in diesem Zusammenhang von 10 Zyklen (Load-to-use). Die erste Cache-Ebene setzt sich wie gehabt aus 32 KByte Instruktions- und 32 KByte Daten-Cache zusammen. Dabei bleibt der L1-Cache im Vergleich zum Penryn beinahe unverändert, beim Nehalem sind lediglich mehr parallele L1-Misses (erfolglose Anfragen) möglich. Mit einer wachsenden Zahl an Kernen ist dies sinnvoll, damit solche Fehlanfragen den Kern nicht ausbremsen.

Selbst wenn wir L2- und L3-Cache addieren, besitzt der Yorkfield auch weiterhin 3 MByte mehr Cache. Dies erklärt auch, warum der Bloomfield lediglich 731 Millionen Transistoren besitzt, während der Yorkfield auf 2x 410 Millionen Transistoren kommt.

Core: 2nd Level Unified TLB
Moderne Computer arbeiten mit virtuellem Speicher, so dass die virtuellen in physikalische Adressen umgerechnet werden müssen. Da diese Arbeit immer wieder anfällt und rechenintensiv ist, werden die Ergebnisse im Translation Lookaside Buffer (TLB) gepuffert. Der Penryn besitzt zwei 1st Level TLBs, einen für Instruktionen und einen zweiten für Daten. Beim Nehalem wurde diese Architektur um einen zweiten Level erweitert, wobei der 2nd Level TLB sowohl für Befehle als auch für Daten genutzt wird.


Fotostrecke mit weiteren und größeren Fotos...

Der 2nd Level TLB bietet Platz für 512 Einträge und soll hierdurch die Leistung im Zusammenspiel mit besonders ausufernden Anwendungen verbessern. Denn wenn die Resourcen der ersten TLB-Ebene nicht mehr ausreichen, müssen physikalische Speicheradressen wieder häufiger berechnet werden.

Uncore: Quick Path Interconnect (QPI)
Da der traditionelle Frontsidebus ausgedient hat, benötigt Intel eine neue Anbindung für die Kommunikation zwischen CPU und Chipsatz. Beim Bloomfield, der eigentlich eine Workstation-Plattform ist, setzt Intel auf Quick Path Interconnect (QPI). Diese serielle Punkt-zu-Punkt-Anbindung ermöglicht nicht nur die Kommunikation zwischen CPU und Chipsatz, sondern auch zwischen mehreren Prozessoren untereinander. Aktuell ist die Zahl der Anbindungen auf zwei begrenzt, somit lassen sich mit QPI zwei Prozessoren und ein Chipsatz verbinden.


Fotostrecke mit weiteren und größeren Fotos...

Die TX- und RX-Links sind jeweils 20 Bit breit: 16 Bit werden für Daten genutzt und 2 Bit für das Protokoll, hinzu kommen zwei Prüfbit (CRC). Quick Path Interconnect arbeitet pro Richtung mit einer maximalen Bandbreite von 6,4 GT/s bzw. 12,8 GB/s, da es sich um eine bidirektionale Kommunikation handelt, stehen bis zu 25,6 GB/s zur Verfügung - für die Zukunft verspricht Intel sogar noch höhere Bandbreiten. Im Desktop-Bereich wird nur der Core i7 Extreme 965 über die vollen 6,4 GT/s und eine mit 3,2 GHz getaktete QPI-Anbindung verfügen. Die preiswerteren Modelle 940 und 920 müssen sich mit 4,8 GT/s bzw. 2,4 GHz begnügen.

Bleibt noch eine Frage: Wird Intels nächste Mainstream-Plattform ebenfalls QPI verwenden? Die Antwort lautet: Nein, QPI wird ausschließlich beim Bloomfield sowie bei Intels neuer Xeon-Generation zum Einsatz kommen. Im Mainstream-Segment, wo solch hohe Bandbreiten nicht benötigt werden, wird Intel auf eine simplere Lösung setzen.

Weiter zu Seite 4 von 39

Inhaltsverzeichnis:
  1. Einleitung: Ziele, Modelle und Preise

    Die Architektur:
  2. Uncore: Der Speicher-Controller (IMC)
  3. Core/Uncore: Cache-Architektur, TLB, Quick Path Interconnect (QPI)
  4. Uncore: Power Control Unit (PCU) und Turbo Modus
  5. Core: Hyperthreading (SMT), SSE 4.2 und Detailsverbesserungen

    Konfiguration und Anmerkungen
  6. Testkonfiguration #1
  7. Testkonfiguration #2 und Probleme, Crossfire und SLI

    Benchmarks: Synthetisch
  8. Benchmarks: SiSoft Sandra 2009 Arithmetik
  9. Benchmarks: SiSoft Sandra 2009 Multimedia
  10. Benchmarks: SiSoft Sandra 2009 Kryptographie
  11. Benchmarks: SiSoft Sandra 2009 Speicherbandbreite
  12. Benchmarks: SiSoft Sandra 2009 Mehrkerneffizienz
  13. Benchmarks: SiSoft Sandra 2009 Cache/Speicher: Latenz/Bandbreite

    Benchmarks: 3D/Profi
  14. Benchmarks: Cinebench 10 64-Bit: Rendering
  15. Benchmarks: POV-Ray 3.70 Beta 29 64-Bit: Raytracing

    Benchmarks: Kompression
  16. Benchmarks: 7-Zip 4.60 Beta: Benchmark
  17. Benchmarks: 7-Zip 4.60 Beta: Packen
  18. Benchmarks: WinRAR 3.80: Packen
  19. Benchmarks: WinAce 2.69: Packen

    Benchmarks: Multimedia
  20. Benchmarks: DivX 6.8.4: Video-Encoding
  21. Benchmarks: Nero Vision 9: Video-Encoding
  22. Benchmarks: Windows Movie Maker: Video-Encoding
  23. Benchmarks: Lame 3.98.2: Audio-Encoding
  24. Benchmarks: Audacity 1.3.5: Audio-Bearbeitung
  25. Benchmarks: OpenOffice.org 3.0.0: PDF-Export

    Benchmarks: 3D/Spiele
  26. Benchmarks: 3DMark06: CPU-Wertung
  27. Benchmarks: 3DMark06: Gesamtwertung
  28. Benchmarks: Assassin's Creed 1.02
  29. Benchmarks: Crysis
  30. Benchmarks: Crysis AAx4
  31. Benchmarks: Company Of Heroes 1.71
  32. Benchmarks: Company Of Heroes 1.71 AAx4
  33. Benchmarks: Call Of Juarez
  34. Benchmarks: Call Of Juarez AAx4

    Energieeffizienz und Übertaktung
  35. Stromverbrauch und Übertaktung #1
  36. Stromverbrauch und Übertaktung #2
  37. Stromverbrauch und Übertaktung #3
  38. Stromverbrauch und Übertaktung #4

    Bewertung
  39. Fazit
Mehr zum Thema:

Angebote von Amazon
Intel Core i7 965
Intel Core i7 940
Intel Core i7 920

Angebote von eBay
Intel Core i7 965
Intel Core i7 940
Intel Core i7 920

Diese Werbefläche wurde deaktiviert. Damit geht Au-Ja.de eine wichtige Einnahmequelle verloren.

Werbung erlauben ]
© Copyright 1998-2016 by Dipl.-Ing. Michael Doering. [ Nutzungsbedingungen ]
Diese Werbefläche wurde deaktiviert. Damit geht Au-Ja.de eine wichtige Einnahmequelle verloren.

Werbung erlauben ]

Ihr Homepage-Baukasten von Wix.

Einfach.
Schnell.
Ohne Vorkenntnisse.
Au-Ja Testurteil:
Sehr Gut
Diese Werbefläche wurde deaktiviert. Damit geht Au-Ja.de eine wichtige Einnahmequelle verloren.

Werbung erlauben ]
generated on
10.12.2016 10:00:26
by Jikji CMS 0.9.9c