Idag är det vår första glimt av Evergreen.
Evergreen är kodnamnet för AMD:s 40nm DX11-baserade produkt. Med AMD:s kodnamnsskifte den här gången är det fortfarande lite tvetydigt om Evergreen är en GPU-klass eller en specifik konfiguration. Även om det är spännande att de delar med sig av vad de är, har AMD fortfarande en hel del kort nära bröstet. Vi vet nästan ingenting om detaljerna i konfigurationen, förutom att den är byggd på en 40nm-process, är helt DX11-kompatibel och att AMD lade fram en bild med titeln “DirectX 11: sooner than you think.”
Naturligtvis, tidigare än jag tror skulle behöva betyda DirectX 11 skulle vara här innan Windows 7 lanseras (vilket är typ omöjligt). Vi fick veta idag att Microsoft har meddelat att Windows 7 kommer att finnas här på hyllorna den 22 oktober. Från AMD:s pressrelease och slide deck är dock det enda säkra spelet på när vi får se hårdvara före årets slut. Men att reta oss med “förr än du tror” skulle bara vara elakt om vi måste vänta så länge.
Om AMD inte behöver spinna om sitt kisel och Evergreen verkligen är komplett från och med idag (bortsett från kvalificering, trimning och rampning av produktion), kan AMD verkligen vara redo att leverera produkten mycket tidigare än i november, och få ut produkten vid sidan av eller i förväg av Windows 7. Allt beror verkligen på en massa saker som de inte kommer att berätta för oss. Naturligtvis är det bara så det är, men det gör det inte mindre frustrerande att inte veta.
Vi kan konstatera från wafer shot AMD förutsatt att det finns cirka 19,5 dies vertikalt och 25,5 dies horisontellt. Eftersom detta är en 300 mm wafer kan vi typ “gissa” chipets dimensioner till ungefär 15,38 mm x 11,76 mm, vilket resulterar i en formarea på lite över 180 mm^2. Detta är mycket mindre än 55nm RV770 som är en 260mm^2 del, så om vi förväntar oss ett liknande prismål för den första Evergreen-matrisen som vi såg med RV770, kan vi se betydande kostnadsbesparingar (och förhoppningsvis kommer denna lilla dyna att leverera en bra generell prestandaförbättring också).
Jämför denna formstorlek med RV740 som väger 137 mm^2 och 826 miljoner transistorer, och vi kan mycket löst uppskatta att Evergreen kan komma in på något över 1 miljard transistorer. Visst har processen justerats sedan RV740 och Evergreen är en annan arkitektur och layout, så skalningen är inte exakt eller direkt, men proportionellt borde AMD kunna passa in så många transistorer på bara 180 mm^2 på 40nm-processen.
Vi kommer definitivt att vara intresserade av att se hur nära våra gissningar är när vi äntligen har hårdvara i handen. Men det här talar fortfarande inte om prestanda. Vår enda riktiga referens för AMD:s mål är att gissa att de kommer att vilja komma in till nästan samma pris som RV770 nådde: intervallet $200 – $300. Med de extra transistorerna, förändringarna i arkitekturen och klockhastighetsfördelarna med 40nm-processen över 55nm, kunde vi rimligtvis se AMD nå det målet.
Visa upp demos och preliminära tankar
Tyvärr har vi inga videor av demos i aktion som de presenteras på Computex. Allt vi behöver fortsätta just nu är en presentation från AMD med några bilder som visar stillbilder från några demos. Här är ett DX11 SDK-exempel som visar underindelningsytor med tessellation.
Eftersom vi ännu inte har hårdvara som kan köra den här demon, kan vi inte riktigt veta hur bra 14 bilder per sekund verkligen är eller vad det betyder. Vi måste vänta tills vi har konkurrenskraftig hårdvara för att göra någon utvärdering av prestanda (eller så måste vi vänta tills AMD visar oss något som vi kan jämföra med nuvarande DX10-hårdvara som körs på Evergreen). Det visades också några andra demos inklusive transcoding och compute shader-baserad AI.
Även om det finns många applikationer som potentiellt kommer att aktiveras av compute shader, kommer det säkert att ta lite tid för utvecklare att bli bekanta och bekväma med att behandla GPU:n som en annan processor för dataparallella beräkningsoperationer. Vår förväntning är att DX11 (och förberedelser för nästa omgång av konsolspelsystem) kommer att fungera som en katalysator för en sista skjuts bort från DX9-baserad hårdvara och in i riket av verklig programmerbarhet.
Även om dynamisk förgrening har varit tillgänglig sedan DX9, har vi inte sett någon stor användning av den eftersom den kan vara mycket resurskrävande och långsam även på modern hårdvara. Ja, det är mycket snabbare idag, men det finns fortfarande saker som inte är praktiska idag trots att vissa algoritmer skulle ha stor nytta av snabb förgrening. Vi hoppas, och det verkar som AMD tror, att DX11-klassens hårdvara kommer att fortsätta trenden med att snabba upp och förbättra förgreningen på GPU:er. Här är en tidslinje som visar ATIs GPU-teknikutveckling på en mycket hög nivå.
Från presentationens sammanhang och vad vi har sett är AMD verkligen intresserade av att driva sin tessellationsteknologi. Tessellation har varit ett alternativ sedan R600, men det har inte tagits på otroligt stort allvar eftersom det inte var en standardfunktion och inte kunde köras på all DX10-hårdvara. DirectX 11 ändrar det, och AMD framhåller deras erfarenhet som en fördel här. Vi får vänta och se vad NVIDIA gör, eftersom erfarenhet inte alltid betyder bättre.
Så den stora affären idag är att AMD visar upp fungerande DX11-kisel på en 40nm-process som kör DX11-demos. Vi förväntar oss DX11 innan årets slut baserat på vad AMD har sagt. Nu när vi vet när Windows 7 kommer (22 oktober) och att AMD redan har Evergreen silicon i sina händer, är vi ganska hoppfulla att AMD kan introducera sin DX11-del före Windows 7 om allt går smidigt för dem från och med nu till dess. Helt klart häftiga grejer som verkligen sätter press på NVIDIA att följa efter och börja prata om deras DX11-svar.