Den kommande Intel Nehalem-processorn har varit i rampljuset i flera månader nu. Däremot och trots den enorma formstorleken och 1,9 miljarder (!) transistorer, är den 6-kärniga Xeon 74xx en väggblomma för både allmänheten och Intels marknadsföring. Men om du har investerat i den nuvarande Intel-plattformen förtjänar den nyligen lanserade Intel 74xx-serien mycket mer uppmärksamhet.
Xeon 74xx, tidigare känd som Dunnington, är verkligen en mycket intressant uppgraderingsväg för den äldre plattformen med fyra uttag. Alla Xeon 74xx använder samma mPGA604-uttag som tidigare Xeon och är elektriskt kompatibla med Xeon 73xx-serien. De Xeon 73xx , även känd som Tigertonvar i princip fyrkärniga versionen av Xeon 53xx (Clovertown) som lanserades i slutet av 2006. Den nya sexkärniga Dunnington kombinerar sex av de senaste 45nm Xeon Penryn-kärnorna på en enda stans. Som ni kanske minns från vår dual socket 45nm Xeon 54xx recension, 45nm Penryn-kärnan är cirka 10% till 20% snabbare än sin äldre 65nm-bror (Merom). Det finns mer: en enorm 12MB till 16MB L3-cache säkerställer att dessa sex kärnor får tillgång till huvudminne med hög latens mycket mindre. Denna enorma L3 minskar också mängden “cache-synkronisering”-trafik mellan processorerna, en viktig flaskhals för de nuvarande Intel-serverplattformarna.
2,66 GHz, 6 kärnor, 3×3 MB L2 och 16 MB L3-cache: en massiv ny Intel-processor
Med minst 10% till 20% bättre prestanda per kärna, två extra kärnor per CPU-paket och en uppgradering som bara kräver en BIOS-uppdatering, bör den senaste Xeon 7460 vara ett attraktivt förslag om du har ont om processorkraft.
Sex kärnor?
Dunnington tillkännagavs vid tidigare IDF:er som “förlänger MP-ledarskapet”. Läsare som läser vår senaste quad socket rapport förstå att detta är ett tveksamt påstående. Sedan AMD introducerade Opteron 8xxx i april 2003 har det aldrig funnits ett ögonblick som Intel kunde leda dansen på marknaden för servrar med fyrsockel. Visst, Intel 73xx kunde överträffa AMD-chippet på vissa områden (rendering), men AMD quad-core kunde fortfarande hålla jämna steg med Intel-chippet i Java, ERP och databasprestanda. När det kommer till HPC var AMD-chippet klart i täten.
Dunnington är kanske inte Intels marknadsförings älskling, men själva chippet är ett mycket aggressivt uttalande: låt oss “bulldoze” AMD ur marknaden med fyrsockel med ett verkligt gigantiskt chip som bara Intel kan producera utan att förlora pengar. Intel är förmodligen – tack vare den imponerande ultralågt läckage 45nm hög-K processteknologi – den enda som kan producera stora mängder processorer som innehåller 1,9 miljarder transistorer, vilket resulterar i en enorm formstorlek på 503 mm2. Det är nästan dubbelt så stort som AMD:s kommande 45nm fyrkärniga CPU Shanghai. Även IBM:s flaggskepp POWER6-processor (upp till 4,7GHz) är bara 341 mm2 och har bara 790 miljoner transistorer.
Processorstorlek och teknikjämförelse | ||||
CPU | antal transistorer (miljoner) | Bearbeta | Dies storlek | Kärnor |
Intel Dunnington | 1900 | 45 nm | 503 | 6 |
Intel Nehalem | 731 | 45 nm | 265 | 4 |
AMD Shanghai | 705 | 45 nm | 263 | 4 |
AMD Barcelona | 463 | 65 nm | 283 | 4 |
Intel Tigerton | 2 x 291 = 582 | 65 nm | 2 x 143 = 286 | 4 |
Intel Harpertown | 2 x 410 = 820 | 45 nm | 2 x 107 = 214 | 4 |
Den enorma, något oregelbundna tärningen – lägg märke till hur de två kärnorna i det övre högra hörnet är längre bort från L3-cachen än de andra fyra – väcker några frågor. En sådan oregelbunden matris kan introducera extra trådfördröjningar, vilket minskar klockhastigheten något. Varför valde inte Intel att välja en 8-kärnig design? Den grundläggande förklaringen som Patrick Gelsinger, General Manager för Intels Digital Enterprise Group, gav var att simuleringar visade att en 6-kärnig med 16 MB L3 överträffade 8-kärnig med en mindre L3 i de applikationer som betyder mest i 4S/8S-socketutrymmet .
Layout av den nya sexkanten
TDP var förmodligen den viktigaste begränsningen som avgjorde valet av sex kärnor, eftersom kärnlogik förbrukar mycket mer ström än cache. En 8-kärnig design skulle göra det nödvändigt att minska klockhastigheten för mycket. Även vid 65nm kunde Intel redan producera cacher som behövde mindre än 1W/MB, så vi kan anta att 16MB-cachen förbrukar runt 16W eller mindre. Det lämnar mer än 100W för de sex kärnorna, vilket tillåter anständiga klockhastigheter vid mycket acceptabla TDP:er som du kan se i tabellen nedan.
Jämförelse av processorhastighet och cache | |||||
Xeon modell | Hastighet (GHz) | Kärnor | L2-cache (MB) | L3-cache (MB) | TDP (W) |
X7460 | 2,66 | 6 | 3×3 | 16 | 130 |
E7450 | 2.4 | 6 | 3×3 | 12 | 90 |
X7350 | 2,93 | 4 | 2×4 | 0 | 130 |
E7440 | 2.4 | 4 | 2×3 | 12 | 90 |
E7340 | 2.4 | 4 | 2×4 | 0 | 80 |
E7330 | 2.4 | 4 | 2×4 | 0 | 80 |
E7430 | 2.13 | 4 | 2×3 | 12 | 90 |
E7420 | 2.13 | 4 | 2×3 | 8 | 90 |
L7455 | 2.13 | 6 | 3×3 | 12 | 65 |
L7445 | 2.13 | 4 | 2×3 | 12 | 50 |
Den andra sidan av myntet är att Dunnington förmodligen använder en L3-cache som körs med halva klockhastigheten för kärnorna. Vi registrerade en 103 cyklisk latensmätt med en 2,66 GHz CPU (39 ns), för L3-cachen.
Dunningtons cachehierarki
Som jämförelse behöver den – visserligen mycket mindre – L3-cachen hos fyrkärniga Opteron 48 cykler (med ett 2,5 GHz-chip, eller 19 ns). L3-cachen är ungefär hälften så snabb som den som finns i Barcelonas kärna, så L3 är en kompromiss där ingenjörerna bytte hastighet för storlek och strömförbrukning.