Om du har följt vår SoC-relaterade täckning har du förmodligen stött på vår täckning av Qualcomms kommande SoCs i deras Mobile Development Platforms (MDPs). Det är ett intressant sätt att få både en känsla för prestandan för en given plattform innan saker är slutgiltiga, och att se hur mycket OEM-tillverkare påverkar den slutliga prestandan.
Qualcomm flög oss ut till San Francisco för att ta en titt på dess nyaste del, APQ8064, som är quad core Krait v2 på upp till 1,5 GHz med Qualcomms nya Adreno 320 GPU och inget basband. Detta är en SoC som främst är avsedd för surfplattor, även om kombinationen av APQ8064 och MDM9615 sannolikt också kommer att vara en vanlig kommande plattform för de högsta telefonerna.
För närvarande är detta samma Krait CPU som det vi har sett i MSM8960 i telefoner som USA-versionerna av Galaxy S 3 och HTC One X. Senare kommer Krait v3 att dyka upp med högre IPC och kortare kritiska vägar (och klockor) upp till 1,7 eller 2 GHz) och en resulterande prestandaökning på 10-15 %. För nu tittar vi dock på 1,5 GHz APQ8064 med en Krait v2 inuti och Qualcomms nyaste skalära GPU-arkitektur med Adreno 320. Vi kommer att prata mer om Adreno 320 närmare enheters leverans, när Qualcomm känner sig bekväm med att prata arkitektur.
Förmodligen den enskilt största anmärkningsvärda förändringen är alternativet i Adreno 320 att byta från en TBR (Tile Based Renderer) till en omedelbar lägesrenderare i farten. Som standard är renderingsläget fortfarande TBR, men ett API är exponerat för att tillåta applikationer att begära omedelbart läge. I framtiden kommer en del heuristik att användas för att avgöra vilket läge som är snabbare, inklusive att rendera vissa bildrutor i omedelbart läge, några bildrutor i TBR-läge. Initiala leveransenheter med Adreno 320 kommer dock bara att exponera ett API tills växlingssystemet är slutfört. Uppdatering: Adreno är fortfarande en TBR, inte TBDR som tidigare nämnts.
När det gäller funktioner lägger Adreno 320 till stöd för OpenGL ES 3.0 (kodnamn Halti) och GPGPU-funktioner med OpenCL 1.2 och RenderScript. När det gäller Windows API:er är Adreno 320 Direct3D 11 funktionsnivå 9_3.
Efter en förmiddag med sessioner om benchmarks och hur de speglar olika prestandaområden (vilket är en annan stor diskussion), fick vi hand om den mobila utvecklingsplattformen för APQ8064, MDP/T APQ8064. MDP för mobil utvecklingsplattform, T för surfplatta. MDP/T inkluderar en 10,1″ WXGA-skärm (1366 x 720), 2 GB LPDDR2 vid 533 MHz (2×32 bitar, PoP), 13 MP bakre kamera, 7 mikrofoner och alla vanliga portar och knappar. Surfplattan kördes Android 4.0.4, och även om mjukvaran förståeligt nog inte är slutgiltig, var saker och ting ganska stabila. Dessutom kommer MDP/T att säljas via Bsquare vid något senare tillfälle för $1299.
Prestanda
Innan vi kommer för långt i vårt prestandatest är det en bra idé att uppdatera de vanliga varningarna. Vi tilläts oövervakad benchmarkingtid med APQ8064 MDP/T, men detta är fortfarande en referensplattform. Slutliga leveransenheter kan köras med olika hastigheter eller leverera olika prestanda baserat på deras programvarukonfiguration. Medan MSM8960 MDP slutade prestera väldigt nära HTC:s One X/S, kan allt hända i den slutliga implementeringen av en SoC.
Vi börjar vår prestandaanalys med GLBenchmark, mer specifikt några av de råa funktionstesten för att se hur saker och ting har förbättrats jämfört med MSM8960:
Råfyllningsgraden nästan tredubblades jämfört med Adreno 225 i HTC One X, och det finns en hälsosam fördel gentemot NVIDIAs Tegra 3 också. Imaginations PowerVR SGX 543MP2 klarar fortfarande en högre fyllnadsgrad, och MP4:an i nya iPad går inte att röra heller.
Rå polygongenomströmning är högre än allt förutom 543MP4, ett imponerande steg framåt från Adreno 225 men fortfarande inte tillräckligt för att överträffa den avancerade ImgTec-lösningen.
Här ser vi nästan 2 gånger triangelgenomströmningen hos Adreno 225, och bättre prestanda än 543MP2. MP4 fortsätter dock att vara ett monster.
Dessa nästa två test är ganska meningslösa eftersom de är bundna av vsync. Förhoppningsvis kommer vi snart att se en nyare version av GLBenchmark som kommer att stressa dessa enheter mer vid infödda upplösningar:
GLBenchmark kommer runt standard vsync-kravet genom att rendera till en offscreen-buffert vid 720p, vilket ger oss en sann äpple-till-äpple-jämförelse av spelliknande prestanda bland alla dessa SoCs. Fyrkärniga S4 Pro med Adreno 320 gör det otroligt bra:
I det äldre Pro-testet är bildhastigheterna vansinnigt höga för de flesta enheterna, vilket indikerar riktmärkets ålder, men Adreno 320:s ställning är mycket bra – näst efter PowerVR SGX 543MP4. Jämfört med Adreno 225 är 320 nästan dubbelt så snabb.
Egypten, det nyaste av de två “spel”-testerna i GLBenchmark, är lite mer stressande. Här kommer Adreno 320 extremt nära SGX 543MP4 i den nya iPaden. Apple upprätthåller en prestandafördel på 6,8 % vid 720p i detta, ett till stor del beräkningsbundet riktmärke. Prestanda här är mer än dubbelt så hög som Adreno 225 och 72 % snabbare än NVIDIAs snabbaste Tegra 3.
Sammantaget ser Adreno 320 ut att vara ett bra steg framåt i prestanda, även om det fortfarande är lite långsammare än det senaste och bästa från Imagination Technologies. Jämfört med vad alla andra levererar i Android-baserade surfplattor/smartphones är Adreno 320 dock lätt den nya kungen av kullen.
Qualcomm integrerade fyra Krait v2-kärnor i APQ8064 som körs på 1,5 GHz, så CPU-prestanda bör variera från mycket lik till betydligt bättre än Snapdragon S4 med dubbla kärnor beroende på arbetsbelastningen. Precis som vi har sett med Tegra 3 kommer tungt gängade arbetsbelastningar att skalas ganska bra medan lätt gängade arbetsbelastningar kommer att se mestadels likadana ut:
Sunspiders prestanda är utmärkt på MDP/T, och levererar faktiskt ett bättre resultat än Medfield-baserade Lava Xolo X900 (1279,4ms). Det är oklart hur mycket av denna prestandaökning jämfört med S4 med dubbla kärnor som beror på de tillagda kärnorna kontra mjukvaruoptimeringarna till MDP/T:s webbläsare.
BrowserMark berättar en mycket mer konservativ historia, men S4 Pro kan fortfarande överträffa den dubbelkärniga S4-baserade One X med 22 %. Återigen gör vi lite äpplen till apelsiner här eftersom webbläsaren och den återstående mjukvarustacken mellan enheterna inte är helt identiska.
Vellamo är Qualcomms egenutvecklade riktmärke för webbprestanda och rullning, som snart kommer att utökas till att omfatta ytterligare några tester utöver JavaScript och rullningsprestanda (mer om det senare). För närvarande söker APQ8064 ut ur resten av förpackningen, men inte med stor marginal. Detta använder återigen WebView som inte är hårt trådad.
BaseMark OS inkluderar ett kraftigt gängat riktmärke som kan träffa alla fyra kärnorna i MDP/T såväl som i de Tegra 3-baserade enheterna. Den totala poängen inkluderar SMP-testet men väger det inte för tungt. Slutresultatet är fortfarande bra för MDP/T; det är den snabbaste Android-enheten vi har testat här.
Vi körde det flertrådade Linpack Android-testet för att bekräfta fyrkärnig skalning och vi såg faktiskt just det. Medan HTC One X är bra för en poäng på cirka 210 MFLOPS, nådde MDP/T med dubbelt så många kärnor 413 MFLOPS. Vi kunde få siffror så höga som 514 MFLOPS, vilket mer är en demonstration av testets volatilitet än något annat.
Sammantaget borde den fyrkärniga S4 Pro leverera allt vi älskar med S4:s prestanda med dubbla kärnor, bara med fler kärnor. Eftersom individuella kärnor kan vara power gated, bör det inte vara mycket av ett kraftstraff om du inte faktiskt behöver den extra kraften. De extra kärnorna bör komma väl till pass med tung multitasking (något vi kan se ännu mer av på Windows RT-surfplattor/notebook-hybrider) eller med den sällsynta tungtgängade applikationen.