Anslut till Senaste Tekniska Nyheter, Bloggar, Recensioner

AMD:s 3:e generationens Opteron kontra Intels 45nm Xeon: en närmare titt

Introduktion

Den nya Xeon 45nm (eller Xeon 54xx-serien) kom till labbet för veckor sedan, så en uppdatering av serverns CPU-riktmärke är försenad. Det finns dock en annan anledning till att vi bestämde oss för att skriva den här artikeln. När AMD lanserade sina nyaste fyrkärniga chips kunde vi bara ge dig en förhandstitt på dess prestanda – inte en fullständig recension. Vi förstod inte till fullo många av prestandaaspekterna i den nya AMD-arkitekturen, så vi bestämde oss för att fördjupa oss lite djupare.

Vi kommer bara att fokusera på prestanda i den här artikeln, eftersom vårt primära mål är att få en uppfattning om var Barcelona (AMDs fyrkärniga), Harpertown (Intel 45nm fyrkärniga Xeon) och Clovertown (Intel fyrkärniga 65nm Xeon) står. För att göra det gjorde vi en minimal profilering av vart och ett av våra benchmarks och vi använde flera nya mikrobenchmarks som kommer att berätta mycket mer än vissa verkliga riktmärken kan. Om du gillar att förstå riktmärkena där ute lite bättre, gräv in.

Den nya 45 Xeon

Den nya 45nm Xeon 54xx-serien, aka “Harpertown”, är fortfarande baserad på Core-arkitekturen, men den har justerats lite. Vi har redan diskuterat dessa förbättringar i detalj här och här, så vi kommer inte att diskutera dem i detalj igen, men här är en snabb översikt:

  • Snabbare 4-bitars avdelare (Radix-16) istället för 2-bitars avdelare
  • Upp till 1600MHz FSB
  • Delad 6MB (24-vägs set associativ) istället 4MB L2-cache (per dual-core tärning)
  • Super Shuffle-motor (för SSE-instruktioner)
  • Split Load Cache Enhancement
  • SSE4

Radix 16-avdelaren är den mest intressanta av dessa förbättringar. Att dividera innebär en upprepning av subtraktioner, tester “om-det-passar” och skiftningar. Om du kan göra detta med fyra bitar åt gången istället för två, betyder det att du kan halvera antalet av dessa iterationer som krävs för att få ditt resultat. Kvadratrotsberäkningen är liknande och drar också nytta av dessa förbättringar. Även om divisioner och kvadratrötter är ganska sällsynta i vanlig programvara, har de en mycket betydande prestandapåverkan. I motsats till de mer “populära” instruktionerna är de inte pipelinerade och latensen för dessa instruktioner är hög. Till exempel tar en multiplikation med flyttal fem cykler och “Clovertown Core”-arkitekturen kan avsluta en varannan cykel tack vare pipelining. En flyttaluppdelning tar dock inte mindre än 32 cykler och kan inte överföras alls.

Nanotekniken är här: en kärna med 820 miljoner transistorer och du får plats med minst två av dem i ett mynt. (Foto av Tjerk Ameel)

Förutom att vara en förbättrad “Clovertown” är den nya Xeon också ett underverk inom nanoteknik med inte mindre än 410 miljoner transistorer på en form på endast 107 mm². Två tärningar gör en fyrkärnig Xeon 54xx. Med tanke på att den här processorn är nära fantastiska processorer som Itanium och Power 6 i SPECint-prestanda, är nya Intel en formidabel motståndare för AMD:s nyaste fyrkärniga.

Det finns mer än CPU såklart. Den nya CPU:n fungerar på den gamla “Bensley/5000P chipset”-plattformen, även om vi inte kunde få den att köra på vårt P5000PSL Intel-moderkort trots att vi tillämpade BIOS-uppdateringen som kom ut tidigt denna månad.

Det finns också en ny HPC/arbetsstationsplattform för Intel Xeon tack vare Seaburg-kretsuppsättningen, som har ett förbättrat snoop-filter. Förutom att minska snoop-trafiken bör den nya styrkretsen också kunna extrahera mer bandbredd ur samma FBDIMM. Stödet för DDR2-800 FBDIMM borde ge ytterligare en prestandahöjning men vår nuvarande testplattform är bara stabil med DDR2-667 FBDIMM.