Anslut till Senaste Tekniska Nyheter, Bloggar, Recensioner

NVIDIA GeForce GTX 680M: Kepler GK104 blir mobil

Origin PC skämde bort lanseringsfesten för GTX 680M lite med deras tillkännagivande av deras nya EON15-S och EON17-S bärbara datorer i morse, men NVIDIA bad oss ​​att undvika att diskutera detaljerna för den nya mobila GPU-juggernauten tills den officiella NDA-tiden. Som du säkert har gissat är den tiden nu (eller 18:00 PDT 4 juni 2012 om du läser detta senare). NVIDIA delade också med sig av lite information om kommande Ultrabooks, som vi kommer till i slutet.

NVIDIA har haft sin beskärda del av framgången med Kepler hittills, och GTX 680-korten fortsätter att sälja slut. Newegg till exempel för närvarande listor 18 GTX 680-kortmen bara en finns för närvarande i lager: den EVGA GTX 680 FTW kommer med en anständig överklocka och ett utgångspris $70 högre än standard GTX 680. På den bärbara sidan har vi redan haft ett par Kepler-baserade GK107 bärbara datorer för granskning, och grafikprestandan har visat en stor förbättring jämfört med tidigare Fermi-mellanregisterkort.

På de avancerade bärbara datorerna har den enda Kepler GPU:n hittills varit en högre klockad GK107, GTX 660M, men att öka kärnklockorna kommer bara att ta dig så långt. NVIDIA har fortsatt att sälja sin tidigare generation GTX 570M och 580M som GTX 670M och 675M (med en liten ökning av kärnklockorna), men uppenbarligen fanns det ett hål på toppen som bara väntade på GTX 680M, och det är nu dags att plugga Det. Nedan är en sammanfattning av de tre av NVIDIAs snabbaste mobila GPU:er för att hjälpa till att sätta GTX 680M i perspektiv.

Specifikationer för NVIDIA High-End Mobile GPU
GeForce GTX 680M GeForce GTX 675M GeForce GTX 660M
GPU och process

28nm GK104

40nm GF114

28nm GK107

CUDA kärnor

1344

384

Upp till 384

GPU klocka

720 MHz

620 MHz

835 MHz

Shader klocka

1240 MHz

Minne Eff. Klocka

3,6 GHz

3GHz

4GHz

Minnesbuss

256-bitars

256-bitars

128-bitars

minnesbandbredd

115,2 GB/s

96 GB/s

64 GB/s

Minne

Upp till 4GB GDDR5

Upp till 2GB GDDR5

Upp till 2GB GDDR5

Bara att köra de råa siffrorna här, har GTX 680M upp till 20 % mer minnesbandbredd än GTX 675M/580M, tack vare den förbättrade minneskontrollern och högre RAM-klockor som finns tillgängliga med Kepler. Den större förbättringen kommer dock inom beräkningsområdet: även om man tar hänsyn till de dubbelhastighets shader-klockorna, har GTX 680M potentiellt 103 % mer shader-prestanda än sin föregångare. NVIDIA ger en uppskattad prestandaförbättring på upp till 80 % jämfört med GTX 580M, vilket är ett enormt steg i generationsprestanda. Och även om Fermi på skrivbordet fortfarande erbjuder potentiellt bättre prestanda i flera arbetsbelastningar, finns det en rimlig chans att klyftan inte kommer att vara lika stor på bärbara datorer – för att inte tala om att beräkning i allmänhet inte är lika stor faktor för de flesta bärbara användare . (Och för de som behöver bärbara datorer med bättre datorprestanda finns det alltid Quadro 5010M – som troligen kommer att kompletteras med en ny Quadro inom en snar framtid.)

Tyvärr får vi vänta lite längre med att göra vår egen interna undersökning av GeForce GTX 680M-prestanda, eftersom vi inte har någon hårdvara i handen. NVIDIA gav dock några prestandariktmärken med en mängd olika spel, och vi kommer att vidarebefordra den informationen under tiden. Som alltid, ta sådan information med en nypa salt, eftersom NVIDIA kanske väljer spel/inställningar som är särskilt väl lämpade för GTX 680M, men för många av titlarna finns det ett standardriktmärke som bör möjliggöra “rättvisa” jämförelser.

Förutsatt att ovanstående diagram använder de inbyggda riktmärkena i spelen som stöder det, har vi några jämförelsepunkter med Alienware M18x i GTX 580M och HD 6990M-konfigurationer. Vi hoppar dock över dem, eftersom det enda spelet där vi verkar köra med identiska inställningar är DiRT 3 (43,8 FPS om du undrar). Lyckligtvis har NVIDIA inkluderat liknande prestandatabeller i tidigare lanseringar, så vi har viss överlappning med deras GTX 580M-information. Först, här är deras fullständiga benchmarking-sida från 580M, och sedan kommer vi att sammanfatta jämförelsepunkterna.

Preliminär jämförelse av spelprestanda
(Använder NVIDIA GTX 580M/680M resultat)
GTX 680M
(NVIDIA i7-3720QM)
GTX 580M
(NVIDIA i7-980X)
Procent
Öka
Aliens vs Predator

59,7

39

53 %

Civilisation V

65,6

48

37 %

DiRT 3

69,5

43

62 %

Far Cry 2

115,6

79

46 %

Lost Planet 2

57,9

33

75 %

Metro 2033

56,2

40

41 %

Stalker: Call of Pripyat

96,4

50

93 %

StoneGiant (DoF Off)

67

46

46 %

StoneGiant (DoF On)

36

25

44 %

Street Fighter IV

165,5

138

20 %

Total War: Shogun 2

97,8

59

66 %

Witcher 2 hög

43,7

26

68 %

Witcher 2 Ultra

20.1

10

101 %

Genomsnittlig prestanda 73,2 48,9 50 %

Även med tanke på skillnaderna mellan testbärbara datorer (Clevos X7200 med en i7-980X jämfört med i7-3720QM), eftersom båda chipsen har samma maximala Turbo Boost-klockor (3,6 GHz på i7-980X och i7-3720QM) plus det faktum att vi bör vara GPU-begränsad och ovanstående poäng ser ganska rimliga ut. De enda spelen som inte ser en ökning på >40 % är Civilization V (som har visat sig vara CPU-begränsad tidigare) och Street Fighter IV (som körs på >120FPS på båda GPU:erna redan). Det finns några titlar där vi till och med ser nästan en fördubbling av prestanda. Vi har inga råa siffror, men NVIDIA hävdar också en 15-20% genomsnittlig prestandafördel jämfört med AMD:s Radeon 7970M – förhoppningsvis kommer vi att kunna göra vårt eget head-to-head inom en snar framtid.

Sammantaget, med NVIDIAs egna siffror ser det ut som att GTX 680M borde vara cirka 50 % snabbare än GTX 580M. Om det inte verkar så mycket, tänk på att skillnaden mellan GTX 480M och GTX 580M bara var runt 20% (enligt NVIDIA och med 3DMark11). En ökning med 50 % av mobil grafikprestanda inom samma kraftomslag är ett stort steg; om Kepler överhuvudtaget lyckas minska energianvändningen så blir det ett ännu större hopp. Med andra ord, en enda GTX 680M i ovanstående spel som använder NVIDIAs egna resultat slutar med att erbjuda 86% av prestanda hos GTX 580M SLI, och den kommer definitivt att använda mycket mindre ström och ha färre huvudvärk än mobil SLI.

Som vanligt hade NVIDIA en mängd annan information att dela med sig av om deras produkt- och mjukvarufunktioner, och med deras senaste drivrutiner lägger NVIDIA till några nya objekt. Nej, vi pratar inte ens om CUDA eller PhysX här (även om NVIDIA åtminstone listar dessa som viktiga funktioner). Optimus får också en plugg, och precis som med 400M- och 500M-serierna har alla 600M GPU:er stöd för Optimus. Skillnaden är att den här gången, istället för att bara Alienware stöder Optimus med deras M17x R3, har NVIDIA även MSI och Clevo ombord för GTX 680M Optimus.

För att kortfattat täcka de andra funktionerna, lägger Kepler till TXAA-stöd (Time based anti-aliasing), en rambaserad kantutjämningsalgoritm som NVIDIA framhåller som tillhandahåller kvalitet nära nivån 8xMSAA men med en prestandaträff liknande den för 2xMSAA – eller alternativt, ännu bättre kvalitet för en prestandahit som liknar 4XMSAA. Det låter som att TXAA för tillfället kommer att kräva applikationsstöd, och NVIDIA tillhandahöll ovanstående bild som visar några av de kommande titlarna som kommer att ha inbyggt TXAA inbyggt i spelet. NVIDIA nämnde också FXAA (provbaserad kantutjämning), som är en full scenskuggningsteknik som kan hjälpa till att ta bort jaggies med en mycket liten prestandaträff (cirka 4%). Nytt med deras senaste drivrutiner är möjligheten att tvångsaktivera FXAA på alla spel.

Ett annat nyare tillägg är Adaptive V-Sync, som på vissa sätt låter liknande Lucids Virtu MVP-lösning. I praktiken låter det dock som att NVIDIA helt enkelt aktiverar/inaktiverar V-Sync baserat på den aktuella bildhastigheten. Om ett spel körs med mer än 60FPS kommer V-Sync att slås på för att förhindra rivning, medan V-Sync stängs av vid <60FPS för att förbättra prestanda och minska stamning.

Förutom GTX 680M bör det finnas en hel del Ultrabook-meddelanden på Computex med stöd för NVIDIA GPU:er. Vi har redan tittat på Acers TimelineU M3, och vi nämnde ASUS UX32A/UX32VD och Lenovos nya U410. Ultrabooks når snabbt den punkt där de är “tillräckligt snabba” för de allra flesta användare; det ena området där de verkar bristfälliga är i grafikprestanda. Ivy Bridge och HD 4000 i ett ULV-chip kan helt enkelt inte ge samma typ av prestanda som vi hittar i högre TDP-chips.

Det är där NVIDIA planerar att vinna många vinster med deras GT 610M (48 kärnor Fermi) och deras GT 620M (96 kärnor Fermi); GT 620M kommer initialt att finnas tillgänglig som en 40nm och 28nm del, men vi försöker fortfarande ta reda på om GT 610M också kommer att ha en 28nm variant. För större bärbara datorer skulle GT 610M inte vara mycket meningsfullt, men i en Ultrabook kan det vara precis vad du behöver. Om så är fallet, håll ögonen på vår Computex 2012 och Ultrabook-täckning, för det kommer säkert mer att komma.