Lanseringen av Kepler-familjen av grafikprocessorer i mars 2012 var något av en avvikelse från det normala för NVIDIA. Genom åren har NVIDIA bland annat blivit kända för sina stora och kraftfulla grafikprocessorer. NVIDIA hade alltid producerat en stor 500 mm2+ GPU för att fungera både som flaggskepps-GPU för deras konsumentlinjer och den grundläggande GPU:n för deras Quadro- och Tesla-linjer, och har alltid lanserats med den stora GPU:n först.
Så när Kepler-familjen lanserades först med GK104 och GK107 GPU:erna – som driver GeForce GTX 680 respektive GeForce GT 640M – var det minst sagt ovanligt. I stället för “Big Kepler” fick vi en mager GPU som var byggd kring grafik först och främst, med fokus på effektivitet och i processen att avstå från mycket av beräkningsprestandan som NVIDIA blivit känt för under den senaste generationen. Slutresultatet av denna effektivitet gav bra utdelning för NVIDIA, med GTX 680 som praktiskt överträffade AMD:s Radeon HD 7970 vid tidpunkten för lanseringen i både rå prestanda och energieffektivitet.
Big Kepler var dock inte glömd. GK110, som först introducerades vid GTC 2012, skulle bli NVIDIAs traditionella stora, kraftfulla grafikprocessor för Kepler-familjen. Att bygga vidare på NVIDIAs arbete med GK104 och samtidigt följa i fotspåren av NVIDIAs datortunga GF100 GPU, skulle GK110 vara NVIDIAs magnum opus för Kepler-familjen.
Tejpad ut senare än resten av Kepler-familjen, har GK110 tagit en lite annorlunda väg för att komma till marknaden. Istället för att lanseras i en konsumentprodukt först, lanserades GK110 först som hjärtat i NVIDIAs Tesla K20-familj av grafikprocessorer, den nya hörnstenen i NVIDIAs snabbt växande GPU-beräkningsverksamhet.
Oak Ridge National Laboratorys Titan superdator
Eller kanske som det är mer känt, GPU:n i hjärtat av världens snabbaste superdator, Oak Ridge National Laboratorys Titan superdator.
Titan-superdatorn var en stor vinst för NVIDIA, och troligen det genombrott de har letat efter. NVIDIA och deras Tesla-familj, en nystartad verksamhet för bara två generationer tidigare, har snabbt tagit sig upp i prestige och storlek, till NVIDIAs stora förtjusning. Deras GPU-datorverksamhet är fortfarande relativt liten – konsument-GPU:er överskrider den och kommer att fortsätta att göra det under överskådlig framtid – men det är nu en beprövad verksamhet för NVIDIA. Mer till saken är dock att vinna kontrakt som Titan är en viktig källa till press och goodwill för företaget, och goodwill som företaget avser att dra nytta av.
Med lanseringen av superdatorn Titan och Tesla K20-familjen nu bakom sig, är NVIDIA nu redo att fokusera sin uppmärksamhet tillbaka på konsumentmarknaden. Redo att ta med sin stora och kraftfulla GK110 GPU till konsumentmarknaden, på typiskt NVIDIA-sätt tänker de göra ett skådespel av den. I NVIDIAs tankar finns det bara ett namn som är lämpligt för det första konsumentkortet som är född av samma GPU som deras största datorprojekt: GeForce GTX Titan.
GeForce GTX Titan: By The Numbers
Vid tidpunkten för lanseringen av GK110 på GTC visste vi inte om och när GK110 någonsin skulle göra det till konsumenternas händer. Ur ett praktiskt perspektiv var GTX 680 fortfarande klart i täten över AMD:s Radeon HD 7970. Samtidigt var Titan superdator ett stort kontrakt för NVIDIA, och något de behövde prioritera. 18 688 551 mm2 GPU:er för en enskild kund är en mycket stor order, och samtidigt fortsatte beställningarna på Tesla K20-kort att strömma in varje dag efter GTC. I slutändan, ja, GK110 skulle komma till konsumentmarknaden. Men inte förrän månader senare, efter att NVIDIA hade chansen att börja fylla Tesla-order. Och idag är den dagen.
Ungefär som lanseringen av GTX 690 före den, har NVIDIA för avsikt att sträcka ut den här lanseringen lite för att maximera mängden press de får. Idag kan vi berätta allt om Titan – dess specifikationer, dess konstruktion och dess funktioner – men inte om dess uppmätta prestanda. För det måste du komma tillbaka på torsdag, då vi kan ge dig våra benchmarks och prestationsanalyser.
GTX Titan |
GTX 690 |
GTX 680 |
GTX 580 |
|
Streama processorer |
2688 | 2 x 1536 | 1536 | 512 |
Texturenheter |
224 | 2 x 128 | 128 | 64 |
ROPs |
48 | 2 x 32 | 32 | 48 |
Kärnklocka |
837 MHz | 915MHz | 1006 MHz | 772 MHz |
Shader klocka |
N/A | N/A | N/A | 1544 MHz |
Boost klocka |
876 MHz | 1019 MHz | 1058MHz | N/A |
Minnes klocka |
6,008 GHz GDDR5 | 6,008 GHz GDDR5 | 6,008 GHz GDDR5 | 4,008 GHz GDDR5 |
Minnesbussbredd |
384-bitars | 2 x 256-bitars | 256-bitars | 384-bitars |
VRAM |
6 | 2 x 2 GB | 2 GB | 1,5 GB |
FP64 |
1/3 FP32 | 1/24 FP32 | 1/24 FP32 | 1/8 FP32 |
TDP |
250W | 300W | 195W | 244W |
Transistorräkning |
7.1B | 2 x 3,5B | 3,5B | 3B |
Tillverkningsprocess |
TSMC 28nm | TSMC 28nm | TSMC 28nm | TSMC 40nm |
Lanseringspris |
999 USD | 999 USD | 499 USD | 499 USD |
För att dyka rakt in i saker och ting, i hjärtat av GeForce GTX Titan har vi GK110 GPU. Eftersom detta är den andra produkten som lanseras baserat på GK110 GPU, finns det inga stora mysterier här om GK110:s kapacitet. Vi har täckt GK110 på djupet ur ett beräkningsperspektiv, så många av dessa siffror borde vara bekanta med våra långtidsläsare.
GK110 är sammansatt av 15 av NVIDIAs SMX:er, som var och en i sin tur är sammansatt av ett antal funktionella enheter. Varje GK110 innehåller 192 FP32 CUDA-kärnor, 64 FP64 CUDA-kärnor, 64KB L1-cache, 65K 32-bitarsregister och 16 texturenheter. Dessa SMX:ar är i sin tur ihopparade med GK110:s 6 ROP-partitioner, var och en sammansatt av 8 ROP:er, 256KB L2-cache och ansluten till en 64-bitars minneskontroller. Sammantaget är GK110 ett massivt chip, som kommer in på 7,1 miljarder transistorer, som upptar 551 mm2 på TSMC:s 28nm-process.
För Titan kommer NVIDIA att använda en delvis inaktiverad GK110 GPU. Titan kommer att ha alla 6 ROP-partitionerna och hela 384-bitars minnesbussen aktiverade, men endast 14 av de 15 SMX:arna kommer att vara aktiverade. När det gäller funktionella enheter ger detta Titan ett slutligt antal 2688 FP 32 CUDA-kärnor, 896 FP64 CUDA-kärnor, 224 texturenheter och 48 ROPs. Detta gör Titan praktiskt taget identisk med NVIDIAs mest kraftfulla Tesla, K20X, som levereras med samma konfiguration. NVIDIA levererar för närvarande inga produkter med alla 15 SMX aktiverade, och även om NVIDIA aldrig riktigt kommer att förklara varför detta är – avkastning, effekt eller annat – om inte annat lämnar det dem ett självklart utlopp för tillväxt om de behöver förbättra Titans prestanda ytterligare , genom att aktivera den 15:e SMX.
Naturligtvis är funktionella enheter bara halva historien, så låt oss prata om klockhastigheter. Som en tumregel klockas inte större GPU:er lika högt som mindre GPU:er, och Titan kommer att följa denna regel. Medan GTX 680 levererades med en basklocka på 1006MHz, levereras Titan till en mer blygsam 837MHz, vilket kompenserar för eventuella klockhastighetsnackdelar med den brutala kraften bakom att ha så många funktionella enheter. Precis som GTX 680 (och till skillnad från Tesla) är boostklockorna återigen närvarande, med Titans officiella boostklocka som kommer in på 876MHz, medan den maximala boostklockan potentiellt kan vara mycket högre.
På minnessidan levereras Titan med hela 6 GB GDDR5. Som ett lyxkort gick NVIDIA sönder här och utrustade helt enkelt kortet med så mycket RAM som är tekniskt möjligt, istället för att stanna vid 3GB. Du skulle dock inte veta det från att titta på deras minnesklockor; även med 24 GDDR5-minneschips, levererar NVIDIA Titan med samma 6GHz effektiva minnesklocka som resten av de avancerade GeForce 600-seriens kort, vilket ger kortet 288GB/sek minnesbandbredd.
För att sätta allt detta i perspektiv, på papper (och vid basklockor), kan GTX 680 erbjuda bara 3,1 TFLOPS FP32-prestanda, 128GTexels/sekund textureringsgenomströmning och 32GPixels/sekund renderingsgenomströmning, driven av 192GB/s minne bandbredd. Titan kan å andra sidan erbjuda 4,5 TFLOPS FP32-prestanda, 187GTexels/sekund textureringsgenomströmning, 40GPixels/sekund renderingsgenomströmning, och drivs av en 288GB/sekund minnesbuss. Detta ger Titan 46 % mer skuggning/beräknings- och strukturprestanda, 25 % mer pixelgenomströmning och hela 50 % mer minnesbandbredd än GTX 680. Enkelt uttryckt, tack vare GK110 är Titan en mycket kraftfullare GPU än vad GK104 kunde åstadkomma.
Naturligtvis med stor makt kommer stora elräkningar, vilket Titan inte är något undantag från. I GTX 680:s strävan efter effektivitet fick NVIDIA GTX 680 ner till en TDP på 195W med ett effektmål på 170W, en anmärkningsvärd position med tanke på både konkurrenterna och NVIDIAs tidigare generations produkter. Titan å andra sidan kommer att ha ett platt effektmål på 250 W – i linje med tidigare generationers stora NVIDIA GPU:er – med sin egen plats i pris/effekthierarkin, cirka 28%-47% högre i energiförbrukning än GTX 680. Dessa värden är nästan identiska med de övre och nedre teoretiska prestandaskillnaderna mellan Titan och GTX 680, så prestandan växer i takt med strömförbrukningen, men bara precis. Ur ett praktiskt perspektiv uppnår Titan en liknande effektivitetsnivå som GTX 680, men som ett komplett datorchip är det utan tvekan inte lika magert. Det finns mycket datorbagage som GK104 inte behövde hantera.