Anslut till Senaste Tekniska Nyheter, Bloggar, Recensioner

NVIDIAs GeForce GTX 480 och GTX 470: 6 månader försenade, var det värt att vänta?

Prolog

Eftersom att designa GPU:er så här stora är “[redacted] hård”

-NVIDIAs VP för produktmarknadsföring Ujesh Desai på GF100

Fermi/GF100/GTX400 har legat på länge. För en bransch där de stora aktörerna vanligtvis är i lås med varandra på något sätt, har denna senaste cykel varit tydligt ur synk. I september 2009 såg vi AMD lansera sin Radeon 5000-serie och tillbringa de kommande 6 månaderna som prestandaledare för den diskreta grafikmarknaden för praktiskt taget alla prisklasser. NVIDIA å andra sidan missade den senaste cykeln med en mil, och när AMD levererade kort i 5000-serien kunde NVIDIA bara prata om High Performance Computing-applikationerna för deras nästa GPU, Fermi. Det skulle bli nästa stora grej, både bildligt och bokstavligt.

I januari fick vi nästa del av Fermi-historien på CES, när NVIDIA var villig att prata om den spelorienterade hårdvaran och applikationerna för den första Fermi GPU:n: GF100. Vi fick reda på att det skulle skilja sig markant från GT200 GPU som driver NVIDIAs GTX200-serie, att NVIDIA skulle bryta upp den traditionella pipeline med fasta funktioner och samtidigt intressera oss särskilt mycket för tessellation. Vad vi inte fick reda på är när den skulle skickas.

Mycket av detta har varit i NVIDIAs händer – en del av det har inte. Vad som är obestridligt är att TSMC, chipgjuteriet som används av både AMD och NVIDIA, inte levererade den typ av avkastning på sin 40nm-process som AMD och NVIDIA förväntade sig. Båda led för det. AMD kunde inte få tillräckligt med livskraftiga chips för att möta efterfrågan på sin 5000-seriedel, vilket lämnade ett spår av besvikna spelare som inte kunde få AMD:s senaste underverk, och begränsar AMD:s förmåga att dra nytta av en av de få gånger i AMD/ATI:s historia där företaget hade ett klart försprång över NVIDIA, och om du frågar AMD begränsar de också deras möjlighet att kontrollera priserna. NVIDIA var under tiden tvungen att hantera det faktum att de försökte producera ett mycket stort chip på en lågavkastande process, en kombination för katastrof med tanke på att storleken är fienden till hög avkastning.

Vad som också är obestridligt är att denna 6 månaders väntan har gynnat få människor. För observatörerna av en bransch där konkurrensen är stenhård såg vi GPU-priser stiga, när AMD och NVIDIA under den senaste generationen slog uppåt hundratals dollar från varandras priser praktiskt taget över en natt. Det kan ha varit bra tider överlag för AMD, men för köpare är den konkurrensutsatta marknaden mycket saknad.

Det för oss till idag. Vi kan se ljuset i slutet av tunneln, slutet på NVIDIAs 6 månader långa resa är nära. Vi har berättat om Fermis datorapplikationer, vi har berättat om Fermis spelapplikationer och nu kan vi äntligen berätta om de första produkterna. Det är dags att säga hej till GTX 400-serien.

Möt GTX 480 och GTX 470

GTX 480 GTX 470 GTX 295 GTX 285 9800+ GTX
Streama processorer

480

448

2 x 240

240

128

Texturadress/filtrering

60/60

56/56

2 x 80/80

80/80

64/64

ROPs

48

40

2×28

32

16

Kärnklocka

700 MHz

607MHz

576 MHz

648MHz

738 MHz

Shader klocka

1401MHz

1215MHz

1242MHz

1476 MHz

1836 MHz

Minnes klocka

924MHz (3696MHz datahastighet) GDDR5

837MHz (3348MHz datahastighet) GDDR5

999MHz (1998MHz datahastighet) GDDR3

1242MHz (2484MHz datahastighet) GDDR3

1100MHz (2200MHz datahastighet) GDDR3

Minnesbussbredd

384-bitars

320-bitars

2 x 448-bitars

512-bitars

256-bitars

Rambuffert

1,5 GB

1,25 GB

2 x 896 MB

1 GB

512 MB

Transistorräkning

3B

3B

2 x 1,4B

1.4B

754M

Tillverkningsprocess

TSMC 40nm

TSMC 40nm

TSMC 55nm

TSMC 55nm

TSMC 55nm

Prisläge

499 USD

349 USD

500 USD

400 USD

150–200 USD

Idag lanserar NVIDIA två kort: GeForce GTX 480 och GeForce GTX 470. Båda är baserade på GF100, den första och största medlemmen i Fermi-familjen. Direkt från början kan vi berätta att inget av korten är ett komplett GF100-chip. Vi vet från NVIDIAs tidigare tillkännagivanden att en komplett GF100 är en 512 SP/kärndel organiserad på ett 4x16x32 sätt, men dessa första delar kommer inte att ha alla GF100:s funktionella enheter aktiverade. Istället kommer vi att få en 480-kärndel för GTX 480 och en 448-kärndel för GTX 470. I slutändan kommer vi inte att se den fulla kraften hos GF100 direkt, men du kan vara säker på att vi någonstans längre fram i tiden Kommer att se en GTX 485 eller GTX 490 med alla GF100:s funktionella enheter aktiverade.


NVIDIAs GeForce GTX 480

Det vi börjar med idag i high-end är GTX 480, ett kort baserat på en GF100 med 1 av de 16 SM:arna inaktiverade som kommer att säljas för $499, vilket gör det till den primära konkurrenten till Radeon 5870. Den funktionshindrade SM:en har ingen inverkan på ROP:erna som är en del av ett separat funktionsblock, men det minskar kortets skuggning, texturering och tessellationskapacitet jämfört med där ett helt GF100-kort skulle vara. Detta ger GTX 480 hela 48 ROPs och 768KB L2-cache för GF100, tillsammans med 60 texturenheter, 15 PolyMorph-motorer och 480 kärnor. Även om den arkitektoniska översynen innebär att vi inte kan jämföra GTX 480 med GTX 285 lika enkelt som vi kunde Radeon 5000-serien med Radeon 4000-serien, är GTX 480 fortfarande på något sätt en fördubblad GTX 285 från en skuggare ståndpunkt.

GTX 470 å andra sidan är en ytterligare nedskärning GF100-baserad produkt som kommer att sälja för $349. Som vi nämnde tidigare har den bara 448 kärnor, en produkt från NVIDIA som inaktiverar 2 av de 16 SM:arna. Tillsammans med att inaktivera SM:erna inaktiverade NVIDIA också 1 av de 6 ROP-klustren, vilket inaktiverar 6 ROP:er, 128KB L2-cache och 2 av 32-bitars minneskanalerna. Detta lämnar oss med 448 kärnor som körs tillsammans med 40 ROPs, 640KB L2-cache, allt på en 320-bitars GDDR5-minnesbuss.


NVIDIAs GeForce GTX 470

Som vanligtvis är fallet för en skördad del tar GTX 470 en klockhastighet jämfört med GTX 480. Kärnklockan faller 13% till 607MHz, och shaderklockan faller samma avstånd till 1215MHz. Minnesklockan å andra sidan sjunker bara med 10% till 837MHz (3348MHz effektiv). Sammantaget ger detta GTX 470 cirka 80 % av skuggnings-, textur- och tessellationskapaciteten hos GTX 480 och 72 % av ROP-kapaciteten och minnesbandbredden.

En sak som fångade vårt öga med allt detta var att NVIDIAs minnesklockor är lägre än vi hade förväntat oss från början. GDDR5 är lättillgänglig upp till 5GHz medan NVIDIA inte går högre än 3,7GHz; Faktum är att mellan den mindre minnesbussen än GTX 285 och de lägre än förväntade minnesklockorna, har GTX 400-serien inte så mycket mer bandbredd än GTX 285 hade. Som det ser ut har GTX 480 bara 11 % mer minnesbandbredd än GTX 285, medan GTX 470 har 15 % mindre än GTX 285.

Med tanke på 384-bitarsbussen antog vi först att NVIDIA hade ännu större minnesbussproblem än vad AMD stötte på för 5000-serien, men som det visade sig är så inte fallet. När vi frågade NVIDIA om att arbeta med GDDR5 berättade de att deras största begränsning inte var bussen som AMD utan snarare brister i deras egen I/O-kontroller, vilket i sin tur gjorde att de missade sina målinriktade minneshastigheter. Till skillnad från AMD som har använt GDDR5 i nästan 2 år, är NVIDIA fortfarande relativt ny på att använda GDDR5 (deras första produkt var GT 240 i slutet av förra året), så vi kan inte säga att vi är helt förvånade här. Om inte annat ger detta NVIDIA gott om utrymme att växa i framtiden om de kan få en 384-bitars minnesbuss upp till samma hastigheter som AMD har fått sin 256-bitars buss.

Detta lämnar oss med den andra elefanten i rummet: skörd på GF100. NVIDIA har inte kommenterat specifikt om avkastningen som kommer ut från TSMC men vi vet även 6 månader senare att AMD fortfarande inte är nöjd med saker och ting, så det borde ge lite vägledning om situationen med tanke på NVIDIAs större tärning. Som det ser ut valde NVIDIA att lansera sin högsta GF100-del med endast 15 av 16 SMs för att nå den “bredaste tillgängligheten”, vilket är ett tydligt tecken på att NVIDIA inte får tillräckligt med fullavkastande och högklockande dies just nu dags att erbjuda en ordentlig oskörd del.

Effekt/värme-situationen bör också nämnas, eftersom den ofta går hand i hand med avkastningsfrågor. Med en 500mm2+ tärning på 40nm-processen borde det inte komma som någon överraskning att både GTX 480 och GTX 470 är heta kort. NVIDIA måste betala pipern för att ha en så stor tärning, och det här är en av platserna där de gör det. TDP för GTX 480 är 250W medan det är 215W för GTX 470; under tiden går korten på tomgång på 47W respektive 33W. NVIDIAs strategi för stora tärningar leder vanligtvis till att de har strömkrävande delar, men ur ett historiskt perspektiv är GTX 480 det hungrigaste hittills för ett enkel-GPU-kort; även GTX280 var inte riktigt lika hög. Vi kommer in på detta mer när vi tar en titt på uppmätt strömförbrukning.