Anslut till Senaste Tekniska Nyheter, Bloggar, Recensioner

Intel Haswell-EP Xeon 14 Core Review: E5-2695 V3 och E5-2697 V3

När du flyttar upp i Xeon-produktstapeln, ju större och mer komplicerad formen är, desto lägre blir utbytet. Intel säljer sina Xeoner med 14-18 kärnor från en toppdesign som väger in på över fem miljarder transistorer, och vi har haft två av 14C-modellerna för granskning: E5-2695 V3 (2,3 GHz, 3,3 GHz turbo) och E5 -2697 V3 (2,6 GHz, 3,6 GHz turbo).

Informationen

Det kan bara ta en speciell transistor för att misslyckas med att bryta en hel CPU. Om det händer i en kärna som en del av logiken eller cacherna, kan den kärnan smältas bort och tärningen kan säljas som en nedre kärndel. Det är så avkastningen förbättras genom att återanvända formarna som har fel i löstagbara sektioner. I slutändan minskar detta den maximala vinsten som erbjuds, men det gör det möjligt för CPU-tillverkare som Intel och AMD att sälja en rad produkter, snarare än bara en från en enda design. Sättet som Intel designar sina avancerade E5 V3 Xeons, från en 18-kärnig tärning, innebär att dess 14 kärnkomponenter antingen har minst två defekter eller är helt okej 18-kärniga modeller men behöver fylla efterfrågan.























Jämförelse av CPU-specifikationer
CPU Nod Kärnor GPU Transistorräkning
(schematiskt)
Dies storlek
Server CPU:er
Intel Haswell-EP 14-18C 22nm 14-18 N/A 5,69B 662 mm2
Intel Haswell-EP 10C-12C 22nm 6-12 N/A 3,84B 492 mm2
Intel Haswell-EP 6C-8C 22nm 4-8 N/A 2.6B 354 mm2
Intel Ivy Bridge-EP 12C-15C 22nm 10-15 N/A 4.31B 541 mm2
Intel Ivy Bridge-EP 10C 22nm 6-10 N/A 2,89B 341 mm2
Konsument-CPU:er
Intel Haswell-E 8C 22nm 8 N/A 2.6B 356 mm2
Intel Haswell GT2 4C 22nm 4 GT2 1.4B 177 mm2
Intel Haswell ULT GT3 2C 22nm 2 GT3 1.3B 181 mm2
Intel Ivy Bridge-E 6C 22nm 6 N/A 1,86B 257 mm2
Intel Ivy Bridge 4C 22nm 4 GT2 1.2B 160 mm2
Intel Sandy Bridge-E 6C 32nm 6 N/A 2,27B 435 mm2
Intel Sandy Bridge 4C 32nm 4 GT2 995 miljoner 216 mm2
Intel Lynnfield 4C 45 nm 4 N/A 774M 296 mm2
AMD Trinity 4C 32nm 4 7660D 1,303B 246 mm2
AMD Vishera 8C 32nm 8 N/A 1.2B 315 mm2

Jag nämnde i recensionen med 12 kärnor att Intel kan spela snabbt och löst med sin binning-process, vilket ger kunderna nästan vad de önskar när det gäller prestanda och kraft, så länge de är villiga att betala det priset. Detsamma kan sägas om marknaden för 14-18 kärnor, men snarare än att erbjuda en mängd enheter erbjuder Intel ett halvdussin, allt från en 2,0 GHz 14-kärnig till E5-2699 V3 2,3 GHz 18-kärnig. Intel skulle kunna släppa ett monster på 65 W, 18 kärnor, och även om det kan komma igenom vid 1,2 GHz, finns inte den här typen av SKU på färdplanen (om du kanske inte uppfyller den höga minsta beställningskvantiteten). Om jag får möjligheten skulle jag vilja se processen genom vilken Intel bestämmer sig för att välja vilka SKU:er som ska lagras för detaljhandeln kontra OEM och anpassade delar. Jag misstänker att det är en kombination av dels marknadsefterfrågan, dels avkastning, dels önsketänkande, men jag hoppas att det åtminstone är systematiskt. Baserat på kärnans orienteringsbild nedan kan det finnas komplikationer med den sista kolumnen med sex kärnor, mot de andra kolumnerna av fyra, antingen i spänningssvarsegenskaper eller diskreta produktionsfel som också kan ha en annan effekt.

Våra prover i dag kommer in med E5-2695 V3 vid 2,3 GHz basfrekvens (3,3 GHz turbo) och E5-2697 V3 vid 2,6 GHz (3,6 GHz turbo). När man överväger Xeon-namnstacken, tas varje nummer från 2695 till 2699 utom från 2696, och som sådan kan man humoristiskt postulera att Intel bara har slut på SKU-namn. Även om ett extra L eller W kan hitta sin väg in om fler modeller kom med i listan.

I vårt senaste test, såväl som tidigare recensioner, visade resultaten att ett 2P-system, såsom den dubbla E5-2650L V3s, fungerade dåligt i de flesta av våra testprogram jämfört med att ha en stor enda CPU i en 1P-sockel i de flesta omständigheter . 1P-arrangemanget tenderar att överträffa ett 2P-system när programvaran inte är byggd för att dra fördel av NUMA-arrangemanget. Intel säljer processorer som E5-1691 V3, ett 14-kärnigt chip för 1P-system, eller så kan vi gå direkt in i E5-2699 V3 för 18 kärnor, men det kommer alltid att finnas en marknad för 2P-spelare som behöver den stora minneskapaciteten eller som använder programvara som liknar Cinema 4D som är medveten om NUMA.


































Intel Xeon E5 2600 v3 SKU-jämförelse
Xeon E5 Kärnor/
Trådar
TDP Klockhastighet (GHz)
Bas – Turbo
Pris
Hög prestanda (35-45 MB LLC)
2699 v3 18/36 145W 2,3-3,6 $4115
2698 v3 16/32 135W 2,3-3,6 $3226
2697 v3 28/14 145W 2,6-3,6 $2702
2695 v3 28/14 120W 2,3-3,3 $2424
“Avancerat” (20-30 MB LLC)
2690 v3 24/12 135W 2,6-3,5 $2090
2685 v3 24/12 120W 2,6-3,5 $2090
2680 v3 24/12 120W 2,5-3,3 $1745
2660 v3 20/10 105W 2,6-3,3 $1445
2658 v3 (E) 24/12 105W 2,2-2,9 $1832
2650 v3 20/10 105W 2,3-3,0 $1167
Mellanregister (15-25 MB LLC)
2640 v3 16/8 90W 2,6-3,4 939 USD
2630 v3 16/8 85W 2,4-3,2 $667
2620 v3 6/12 85W 2,4-3,2 422 $
Frekvensoptimerad (10-20MB LLC)
2687W v3 20/10 160W 3,1-3,5 $2141
2667 v3 16/8 135W 3,2-3,6 $2057
2643 v3 6/12 135W 3,4-3,7 $1552
2637 v3 4/8 135W 3,5-3,7 996 USD
Budget (15 MB LLC)
2609 v3 6/6 85W 1.9 306 USD
2603 v3 6/6 85W 1.6 213 USD
Strömoptimerad (20-30 MB LLC)
2650L v3 24/12 65W 1,8-2,5 $1329
2648L v3 (E) 24/12 75W 1,8-2,5 $1544
2630L v3 16/8 55W 1,8-2,9 612 USD

De stora kärnorna får en stor effektbudget och ett stort pris att matcha. Förflyttningen från 2695 till 2697 är bara några hundra MHz, men Intel tar ut och ytterligare $278 för privilegiet med en ökning av 25 TDP. När det gäller frekvenssvar följer båda CPU:erna samma väg, vilket markerar ytterligare 300 MHz för skillnaden i effekt och pris.

Om vi ​​gjorde några grundläggande 24/365 100% användningsberäkningar, med TDP och $0,10/kWh, skulle 2697 V3 förbruka 1270 kWh och kosta $127/år jämfört med 2695 V3 som skulle förbruka 1050 kWh och kosta $105/år. Detta inkluderar uppenbarligen inte någon extra kylning som behövs, men skillnaden på $22 i effekt per år mot $278 i CPU-prisskillnaden skulle indikera 15 års drift för att kompensera skillnaden. Det är klart att kostnaden per CPU spelar större roll när det gäller hur mycket arbete som kommer att göras per tidsenhet. Om kontraktet tar kortare tid att slutföra, kan det påverka preferensen när det gäller den snabbare CPU:n om kontraktet är CPU-beräknings- eller svarsbundet.

Eftersom detta är den tredje i vår senaste serie av Xeon E5-2600 v3 prestandatäckning, har vi täckt de flesta tekniska data i våra tidigare två omgångar angående 10 kärnor och 12 kärnor prestanda. Vi överför data från dessa tester, men hänvisar tillbaka för detaljer om chipset och DRAM-information, samt Johans omfattande recension täcker på djupet fler av de serverfokuserade aspekterna av Xeon E5 v3-designen.

Testuppsättning

Precis som med de tidigare recensionerna kunde vi, på grund av den tillgängliga timingen för att testa vart och ett av våra CPU-prover, bara få ett begränsat utbud av E5-2695 V3 benchmarkresultat. Vi kunde dock köpa två E5-2697 V3-processorer för dubbla 14-kärniga analyser som ledde till en 56-tråds gigant.

Stort tack till…

Vi måste tacka följande företag för att de vänligen tillhandahåller hårdvara till vår testbädd:

Tack till OCZ för att förse oss med PSU:er och SSD:er.
Tack till G.Skill för att förse oss med minne.
Tack till Corsair för att förse oss med en AX1200i PSU.
Tack till MSI för att förse oss med NVIDIA GTX 770 Lightning GPU:er.
Tack till Rosewill för att förse oss med PSU:er och RK-9100 tangentbord.
Tack till ASRock för att förse oss med något IO-testkit.
Tack till Cooler Master för att förse oss med Nepton 140XL CLC.
Tack till GIGABYTE-server för att ha lånat oss några processorer och Dynatron CPU kylare.

Ladda Delta Strömförbrukning

Strömförbrukning testades på systemet i en enda MSI GTX 770 Lightning GPU-konfiguration med en väggmätare ansluten till OCZ 1250W strömförsörjning. Denna strömförsörjning är guldklassad, och eftersom jag är i Storbritannien på en 230-240 V-försörjning, leder den till ~75% effektivitet > 50W och 90%+ effektivitet vid 250W, lämplig för både tomgång och multi-GPU-laddning. Denna metod för effektavläsning tillåter oss att jämföra strömhanteringen för UEFI och kortet för att förse komponenter med ström under belastning, och inkluderar typiska PSU-förluster på grund av effektivitet.

Vi tar effektdelta skillnaden mellan tomgång och belastning som vårt testade värde, vilket ger en indikation på effektökningen från CPU:n när den utsätts för stress.