Anslut till Senaste Tekniska Nyheter, Bloggar, Recensioner

Intel Xeon 7460: Sex kärnor till Bulldoze Opteron

Den kommande Intel Nehalem-processorn har varit i rampljuset i flera månader nu. Däremot och trots den enorma formstorleken och 1,9 miljarder (!) transistorer, är den 6-kärniga Xeon 74xx en väggblomma för både allmänheten och Intels marknadsföring. Men om du har investerat i den nuvarande Intel-plattformen förtjänar den nyligen lanserade Intel 74xx-serien mycket mer uppmärksamhet.

Xeon 74xx, tidigare känd som Dunnington, är verkligen en mycket intressant uppgraderingsväg för den äldre plattformen med fyra uttag. Alla Xeon 74xx använder samma mPGA604-uttag som tidigare Xeon och är elektriskt kompatibla med Xeon 73xx-serien. De Xeon 73xx , även känd som Tigertonvar i princip fyrkärniga versionen av Xeon 53xx (Clovertown) som lanserades i slutet av 2006. Den nya sexkärniga Dunnington kombinerar sex av de senaste 45nm Xeon Penryn-kärnorna på en enda stans. Som ni kanske minns från vår dual socket 45nm Xeon 54xx recension, 45nm Penryn-kärnan är cirka 10% till 20% snabbare än sin äldre 65nm-bror (Merom). Det finns mer: en enorm 12MB till 16MB L3-cache säkerställer att dessa sex kärnor får tillgång till huvudminne med hög latens mycket mindre. Denna enorma L3 minskar också mängden “cache-synkronisering”-trafik mellan processorerna, en viktig flaskhals för de nuvarande Intel-serverplattformarna.

2,66 GHz, 6 kärnor, 3×3 MB L2 och 16 MB L3-cache: en massiv ny Intel-processor

Med minst 10% till 20% bättre prestanda per kärna, två extra kärnor per CPU-paket och en uppgradering som bara kräver en BIOS-uppdatering, bör den senaste Xeon 7460 vara ett attraktivt förslag om du har ont om processorkraft.

Sex kärnor?

Dunnington tillkännagavs vid tidigare IDF:er som “förlänger MP-ledarskapet”. Läsare som läser vår senaste quad socket rapport förstå att detta är ett tveksamt påstående. Sedan AMD introducerade Opteron 8xxx i april 2003 har det aldrig funnits ett ögonblick som Intel kunde leda dansen på marknaden för servrar med fyrsockel. Visst, Intel 73xx kunde överträffa AMD-chippet på vissa områden (rendering), men AMD quad-core kunde fortfarande hålla jämna steg med Intel-chippet i Java, ERP och databasprestanda. När det kommer till HPC var AMD-chippet klart i täten.

Dunnington är kanske inte Intels marknadsförings älskling, men själva chippet är ett mycket aggressivt uttalande: låt oss “bulldoze” AMD ur marknaden med fyrsockel med ett verkligt gigantiskt chip som bara Intel kan producera utan att förlora pengar. Intel är förmodligen – tack vare den imponerande ultralågt läckage 45nm hög-K processteknologi – den enda som kan producera stora mängder processorer som innehåller 1,9 miljarder transistorer, vilket resulterar i en enorm formstorlek på 503 mm2. Det är nästan dubbelt så stort som AMD:s kommande 45nm fyrkärniga CPU Shanghai. Även IBM:s flaggskepp POWER6-processor (upp till 4,7GHz) är bara 341 mm2 och har bara 790 miljoner transistorer.












Processorstorlek och teknikjämförelse
CPU antal transistorer (miljoner) Bearbeta Dies storlek Kärnor
Intel Dunnington 1900 45 nm 503 6
Intel Nehalem 731 45 nm 265 4
AMD Shanghai 705 45 nm 263 4
AMD Barcelona 463 65 nm 283 4
Intel Tigerton 2 x 291 = 582 65 nm 2 x 143 = 286 4
Intel Harpertown 2 x 410 = 820 45 nm 2 x 107 = 214 4

Den enorma, något oregelbundna tärningen – lägg märke till hur de två kärnorna i det övre högra hörnet är längre bort från L3-cachen än de andra fyra – väcker några frågor. En sådan oregelbunden matris kan introducera extra trådfördröjningar, vilket minskar klockhastigheten något. Varför valde inte Intel att välja en 8-kärnig design? Den grundläggande förklaringen som Patrick Gelsinger, General Manager för Intels Digital Enterprise Group, gav var att simuleringar visade att en 6-kärnig med 16 MB L3 överträffade 8-kärnig med en mindre L3 i de applikationer som betyder mest i 4S/8S-socketutrymmet .

Layout av den nya sexkanten

TDP var förmodligen den viktigaste begränsningen som avgjorde valet av sex kärnor, eftersom kärnlogik förbrukar mycket mer ström än cache. En 8-kärnig design skulle göra det nödvändigt att minska klockhastigheten för mycket. Även vid 65nm kunde Intel redan producera cacher som behövde mindre än 1W/MB, så vi kan anta att 16MB-cachen förbrukar runt 16W eller mindre. Det lämnar mer än 100W för de sex kärnorna, vilket tillåter anständiga klockhastigheter vid mycket acceptabla TDP:er som du kan se i tabellen nedan.
















Jämförelse av processorhastighet och cache
Xeon modell Hastighet (GHz) Kärnor L2-cache (MB) L3-cache (MB) TDP (W)
X7460 2,66 6 3×3 16 130
E7450 2.4 6 3×3 12 90
X7350 2,93 4 2×4 0 130
E7440 2.4 4 2×3 12 90
E7340 2.4 4 2×4 0 80
E7330 2.4 4 2×4 0 80
E7430 2.13 4 2×3 12 90
E7420 2.13 4 2×3 8 90
L7455 2.13 6 3×3 12 65
L7445 2.13 4 2×3 12 50

Den andra sidan av myntet är att Dunnington förmodligen använder en L3-cache som körs med halva klockhastigheten för kärnorna. Vi registrerade en 103 cyklisk latensmätt med en 2,66 GHz CPU (39 ns), för L3-cachen.

Dunningtons cachehierarki

Som jämförelse behöver den – visserligen mycket mindre – L3-cachen hos fyrkärniga Opteron 48 cykler (med ett 2,5 GHz-chip, eller 19 ns). L3-cachen är ungefär hälften så snabb som den som finns i Barcelonas kärna, så L3 är en kompromiss där ingenjörerna bytte hastighet för storlek och strömförbrukning.