Anslut till Senaste Tekniska Nyheter, Bloggar, Recensioner

Den stora utjämnaren: Apple, Android och Windows Tablet GPU jämfört med GL/DXBenchmark 2.7

Under de senaste åren har vi beklagat läget för riktmärken för mobila plattformar. Det ständiga avståndet från de som hade funnits tillräckligt länge för att komma ihåg när alla PC-riktmärken var hemska var att vänta på lanseringen av Windows 8 och RT. Utgivningen av dessa två operativsystem skulle föra in många av de traditionella PC-benchmark-leverantörerna i striden. Medan vi förväntar oss att se nya riktmärken för Android, iOS, Windows RT och Windows 8 från Futuremark och Rightware, är det våra gamla vänner på Kishonti som är först ut ur porten med ett riktmärke för flera OS/API/plattformar. GLBenchmark har funnits på både Android och iOS ett tag nu, men vi kan äntligen dela information och prestandadata med DXBenchmark – GLB:s analog för Windows RT/8.

Som namnskillnaden antyder använder DXBenchmark Microsofts DirectX API medan GLBenchmark förlitar sig på OpenGL ES. Bara API-skillnaden gör det svårt att jämföra plattformar, särskilt eftersom vi jämför mellan API:er, operativsystem och hårdvara – men vi har åtminstone möjligheten att få en grov uppfattning om hur dessa plattformar står sig mot varandra. Det förväntas många förbättringar med Windows Blue senare i år ur en plattformsoptimeringssynpunkt från ARM-baserade SoC-leverantörer, så jag skulle inte läsa för mycket i någon av Android vs Windows RT-jämförelser av samma hårdvara (även om några nyckelresultat hamnar mycket nära).

Även om GLBenchmark 2.7 ännu inte drar nytta av OpenGL ES 3.0 (GLB 3.0 kommer att leverera det), uppdaterar den testerna avsevärt för att omkalibrera prestanda med tanke på framstegen inom modern hårdvara. Version 2.7 tar bort klassiskt, behåller Egypt HD och lägger till ett nytt test, T-Rex HD, med en dinosaurie som jagar en flicka på en smutscykel:


Scenkomplexiteten ökar enormt med T-Rex HD-riktmärket. GLBenchmark har historiskt sett varit mer beräkningsbunden än begränsad av minnesbandbredd. Övergången till T-Rex HD som det nya flaggskeppstestet fortsätter trenden. Medan vi ser skalning i genomsnittlig geometrikomplexitet, djupkomplexitet och genomsnittliga minnesbandbreddskrav, är det verkligen i antalet skuggningsinstruktioner som vi ser den största ökningen i komplexitet:










GL/DXBenchmark 2.7: T-Rex HD jämfört med Egypt HD Benchmark
Ökning av T-Rex HD
Genomsnittlig geometrikomplexitet +55 %
Genomsnittligt djupkomplexitet +41 %
Genomsnittliga bandbreddskrav för texturminne +41 %
Genomsnittligt antal Shader-instruktioner +165 %

T-Rex HD bör dra nytta av extra minnesbandbredd, men ökningar i råberäkningsprestanda kommer att vara mest synliga. Med tanke på den relativt statiska karaktären hos förbättringar av minnesbandbredd, är det meningsfullt att skala skuggningsinstruktioner för att öka komplexiteten.

Precis som tidigare kan både GL och DXBenchmark 2.7 köras i lägena på skärmen (native resolution, v-sync aktiverad) och offscreen (1080p, v-sync inaktiverad).

Android- och iOS-versionerna behåller gränssnittet för sina föregångare, medan DXBenchmark 2.7 introducerar en Windows RT/8-smaksatt version av gränssnittet:


Det kommer att finnas en enhetlig databas med poäng över både GL och DXBenchmark när den senare får tillräckligt många bidrag.

Lågnivåtesterna är jämförbara mellan GLBenchmark 2.5 och 2.7, endast resultat från det nya T-Rex HD-riktmärket kan inte jämföras med något som GLBenchmark 2.5 producerat (av uppenbara skäl).

Nu är det dags för den spännande delen. De vanliga misstänkta från iOS- och Android-världen är närvarande, jag inkluderade inte något långsammare än en Tegra 3 med tanke på hur låga T3-poäng i T-Rex HD-testet. Från Windows RT-lägret har vi Microsofts Surface RT (Tegra 3) och Dells XPS 10 (APQ8060A/Adreno 225). Den enda 32-bitars representanten för Windows 8 Pro är ASUS VivoTab Smart (Atom Z2560/PowerVR SGX 545). Slutligen, med Windows 8 Pro (x64) har vi Microsofts Surface Pro (Core i5-3317U/HD 4000) och Razer Edge (Core i7-3517U/GeForce GT 640M LE).

Som alltid kommer vi att börja med lågnivåresultaten och gå över till scentesterna:

När vi tittar på testerna för fyllnadsgrad har vi den första indikationen på hur Intels HD 4000-grafik kan jämföras med de bästa i surfplattan. Surface Pro levererar utan begränsningar en fyllnadsgrad på över 2 gånger så stor som 4:e generationens iPad. NVIDIAs GeForce GT 640M LE levererar nästan 3 gånger fyllningshastigheten för iPad 4.

Mali-T604 i Googles Nexus 10 hamnar mellan iPad 4 och iPad mini, medan Tegra 3 hamnar snabbare än både Clover Trail och Qualcomm Windows RT-plattformarna. Det är intressant att notera den stora skillnaden i fyllnadsgrad mellan Nexus 7 (Android/Tegra 3) och Surface RT (Windows RT/Tegra 3). Man skulle kunna tro att drivrutinens mognad skulle vara bättre på Windows för NVIDIA, men om man antar att detta inte är någon stor API-skillnad kan det mycket väl vara att Tegra 3 på Android är mer mogen.

Gapet i geometriprestanda mellan Intels HD 4000 och Imagination Techs PowerVR SGX 554MP4 växer till över 2,5x. Surface RT och Nexus 7 byter lägen och växer mycket närmare än de var i fyllningstestet. Qualcomms Windows RT-plattform ligger kvar i botten av listan, och Intels Clover Trail är fortfarande en besvikelse på grafikavdelningen.

Öka komplexiteten i triangeltestet och saker och ting förändras inte alltför mycket.

När vi går vidare till scentesterna har vi en första titt på det nuvarande landskapet av T-Rex HD-prestanda på surfplattor. När Egypt HD först kom ut kunde de bästa SoC:erna knappt bryta 20 fps med majoriteten av plattformarna som levererade mindre än 13 fps. Under de 8 månaderna sedan släppet av GLBenchmark 2.5 har den avancerade stapeln flyttats upp avsevärt. De bästa SoC:erna för surfplattor kan nu leverera mer än 40 fps i Egypt HD, med även de senaste smartphoneplattformarna som når 30 fps. T-Rex HD trycker på återställningsknappen, med de snabbaste ARM-baserade SoC:erna som toppar med 16 fps.

När vi tittar på resultaten utanför skärmen får vi äntligen vad vi kom hit för. Intels HD 4000 lyckas leverera 3x prestanda från PowerVR SGX 554MP4, uppenbarligen även på en mycket högre strömförbrukningsnivå. Ivy Bridge-processorn som används i Surface Pro har en 17W TDP, och det är troligt att A6X som används i iPad 4 är någonstans söder om 5W. Den stora frågan här är hur snabbt Intel kan skala ner sin kraft kontra hur snabbt kan ARM-killarna skala upp sin prestanda. Att hävda att ARM (och dess partners) inte kan bygga högpresterande hårdvara är lika felaktigt som att säga att Intel inte kan bygga hårdvara med låg effekt. Båda lägren valde helt enkelt olika optimeringspunkter på effekt/prestandakurvan, och båda arbetar för närvarande med att bygga det de inte har. Den verkliga debatten är inte om varje sida är kapabel att vara snabbare eller lägre, utan vilken sida som kommer dit först, tillförlitligt och med en bra affärsmodell.

För att sätta dessa resultat i perspektiv har GPU:n i Xbox 360 fortfarande cirka 3 gånger så stor beräkningskraft som vad som finns i iPad 4. Vi närmar oss att ha nuvarande (snart tidigare) genkonsolprestanda i våra ultramobila enheter, men det kommer att ta ytterligare ett eller två år att komma dit i de riktigt lågeffektsenheter. Surface Pro finns redan där.

Resten av spelarna här är inte så intressanta. Allt från Tegra 3 till gamla A5 i iPad mini presterar ganska lika när de står inför samma skärmupplösning (1080p). Trots placeringar i några av de lägre nivåerna har Qualcomms åldrande APQ8060A-plattform i Dell XPS 10 (Windows RT) en hälsosam prestandafördel jämfört med Intels Atom Z2560 – båda är dock inte särskilt spännande delar ur grafikprestandasynpunkt. Det är intressant att notera hur nära Surface RT och Nexus 7 är här, med tanke på att de kör olika operativsystem, använder olika API:er men drivs av samma Tegra 3 SoC.

Det enda andra scentestet vi har är Egypt HD, vilket är en känd kvantitet nu för tiden. De enda nya bitarna är inkluderingen av Windows-spelare som använder DXBenchmark:

Allas prestanda ser mycket bättre ut under Egypt HD-testet, vilket naturligtvis är motivationen för att skapa T-Rex HD-testet. Intressant att notera är också att Apple/Intel-gapet krymper lite här, nu är fördelen bara 2x. Det är viktigt att sätta allt detta i perspektiv. Om ditt slutmål är att kunna köra en mer tung arbetsbelastning som T-Rex HD, så har de flesta surfplattor en lång väg kvar att gå. Om Epics Citadel-demoversion på Android är någon indikation, finns det dock mycket som kan göras även med den vanliga prestandanivån som finns tillgänglig på smartphones och surfplattor idag. Att identifiera och leverera den bästa prestandan oavsett vilken sweet spot kan vara är verkligen namnet på spelet här, och det är något som ARM-folket har gjort ett fantastiskt jobb med att spela.

Jag är väldigt nyfiken på att se hur dessa grafer förändras under de kommande två åren. Jag misstänker inte att Haswell kommer att sänka toppeffekten på plattformen tillräckligt lågt för att verkligen ses som ett alternativ till något som en iPad, men med Broadwell (2014) och Skylake (2015) kan det vara en möjlighet. Det faktum att dessa diagram är till och med så nära som de är, och spänner över 7-tums surfplattor hela vägen upp till fullskalig PC-hårdvara, är ett imponerande uttalande om inverkan av den mobila revolutionen.