Anslut till Senaste Tekniska Nyheter, Bloggar, Recensioner

The Bulldozer Aftermath: Gräva ännu djupare

Det har gått månader sedan AMDs Bulldozer-arkitektur överraskade hårdvaruentusiasten med prestanda överallt. Åsikterna varierar mycket från “serverriktmärken är här, och de är en katastrof“till “Bästa serverprocessor 2011”. Det minsta man kan säga är att egenheterna i AMD:s senaste CPU-arkitektur har rört upp mycket damm.

Nu när dammet har lagt sig flisar Bulldozern står nu för mer än hälften av Opterons sändningar och intäkter. Sedan AMD:s finansanalytikerdag (2 februari 2012) har vi nya kodnamn: den förbättrade bulldozerarkitekturen “Piledriver” kommer att driva “Abu Dhabi”-chippet, en ersättning för det nuvarande toppserverchippet “Interlagos”. AMD är helt klart engagerad i den nya “Bulldozer”-riktningen: att passa in så många kärnor som möjligt i ett visst kraftomslag för att förbättra trådgenomströmningen, samtidigt som man försöker “hålla linjen” på entrådiga prestanda.

I teorin borde de nya 16-kärniga Interlagos ha erbjudit någonstans runt en 33% ökning i de flesta högtrådade applikationer. Verkligheten är tyvärr inte så rosenröd: i många högtrådade serverapplikationer som OLAP-databaser och virtualisering lyckas den nya Opteron 6200 inte imponera och är bara några få procent snabbare än sin äldre bror, Magny-Cours med 12 kärnor. Det finns till och med tillfällen då den äldre Opteron är snabbare.

Vissa, inklusive källor inom AMD, har anklagat Global Foundries för att inte leverera högre klockade SKU:er. Visst, klockhastighetsmålen för Interlagos var förmodligen närmare 3GHz istället för 2,3GHz. Men det förklarar inte varför de extra heltalskärnorna inte levererar. Vi blev lovade upp till 50 % högre prestanda tack vare de 33 % extra kärnornamen vi fick som mest 20 %.

Kombinationen av låg entrådig prestanda, misslyckandet med att verkligen överträffa föregående generation i högtrådade applikationer, den relativt höga strömförbrukningen vid full belastning och det faktum att CPU:n är designad för höga klockhastigheter ger många människor en viss känsla av Déjà vu: är detta AMD:s version av Pentum 4?

En av våra läsare, “Iketh”, talade upp och uttryckte åsikten från många av våra läsare:

“Tyvärr var tanken fortfarande i bakhuvudet när jag läste varför AMD uppfann Pentium 4 på nytt? Jag förstår det bara inte.”

En annan läsare med smeknamnet “Clagmaster” kommenterade:

“En kärna av det här komplexet har enligt min mening inte optimerats till sin fulla potential. Räkna med bättre prestanda när AMD introducerar senare stegningar av denna kärna med avseende på strömförbrukning och högre klockfrekvenser.”

Även om det redan har gjorts en hel del försök att förstå vad Bulldozer handlar om, kan vi inte låta bli att känna att många frågor fortfarande är obesvarade. Eftersom den här arkitekturen är grunden för AMD:s server, arbetsstation och bärbara framtid (Trinity är baserat på den förbättrade Bulldozer-kärnan med kodnamnet “Piledriver”), den är intressant nog att gräva lite djupare. Tog AMD fel med den här arkitekturen? Och om inte, kan den första implementeringen “Bulldozer” fixas relativt enkelt?

Vi bestämde oss för att fördjupa oss i SAP- och SPEC CPU2006-resultaten, samt att profilera våra egna benchmarks. Genom att använda profildata och korrelera den med vad vi vet om AMDs Bulldozer och Intels Sandy Bridge försöker vi lösa pusslet.