Arm’s New Mali-G77 & Valhall GPU Architecture: A Major Leap

0 Shares

Längs dagens tillkännagivande av den nya Cortex-A77 CPU-mikroarkitekturen är det förmodligen större tillkännagivandet Arms avtäckning av den nya Valhall GPU-arkitekturen och den nya Mali-G77 GPU. Det har gått tre år sedan avslöjandet av Bifrost-arkitekturen, och när industrin och arbetsbelastningarna fortsätter att utvecklas, så måste företagets GPU: er.

Valhall och nya Mali-G77 följer upp de senaste tre generationerna av Mali GPU: er med några betydande förbättringar i prestanda, densitet och effektivitet. Medan förra årets G76 introducerade några stora förändringar i beräkningsarkitekturen för exekveringsmotorerna, går G77 mycket längre och avviker från Arms relativt ovanliga beräkningskärndesign.

En återblick på Bifrost – tredje gången är charmen

Det är inte så stort som en hemlighet att de senaste åren inte har varit så snälla mot Arms GPU-IP-erbjudanden. När den första Bifrost-GPUn – Mali-G71 tillkännagavs 2016 och tillverkades senare samma år i Kirin 960 och Exynos 8895, hade vi förväntat oss goda prestanda- och effektivitetsvinster.

Bifrost var Arms första skalära GPU-arkitektur, med avvikelse från den tidigare generationens (Midgard: T-600, 700 & 800-serien) vektorinstruktionsdesign. Förändringen var grundläggande och liknade vad vi såg GPU-leverantörer som AMD och Nvidia introducerade med sina nya GCN- och Tesla-arkitekturer förra decenniet.

Tyvärr var de två första generationerna av Bifrost, Mali-G71 och efterföljande G72 inte särskilt bra GPU: er. Arms två ledande licensinnehavare, HiSilicon och Samsung, kom båda ut med ganska nedslående SoC när det kom till deras grafikprocessorer dessa två generationer. Särskilt Kirin 960 och 970 var extremt dåliga i detta avseende och jag skulle hävda att det hade ganska stor inverkan på Huawei och Honors produktplanering och marknadsföring.

GFXBench Aztec Ruins - Normal - Vulkan / Metal - Off-screen

GFXBench Manhattan 3.1 Effektivitet utanför skärmen
(System Active Power)
Mfc. Bearbeta FPS Genomsnitt Kraft
(W)
Perf / W
Effektivitet
iPhone XS (A12) varm 7FF 76,51 3,79 20,18 fps / W
iPhone XS (A12) kall / topp 7FF 103,83 5.98 17,36 fps / W
Galaxy 10+ (Snapdragon 855) 7FF 70,67 4,88 14,46 fps / W
Galaxy 10+ (Exynos 9820) 8LPP 68,87 5.10 13,48 fps / W
Galaxy S9 + (Snapdragon 845) 10LPP 61,16 5,01 11,99 fps / W
Huawei Mate 20 Pro (Kirin 980) 7FF 54,54 4,57 11,93 fps / W
Galaxy S9 (Exynos 9810) 10LPP 46.04 4,08 11,28 fps / W
Galaxy S8 (Snapdragon 835) 10LPE 38,90 3,79 10,26 fps / W
LeEco Le Pro3 (Snapdragon 821) 14LPP 33.04 4.18 7,90 fps / W
Galaxy S7 (Snapdragon 820) 14LPP 30,98 3.98 7,78 fps / W
Huawei Mate 10 (Kirin 970) 10FF 37,66 6.33 5,94 fps / W
Galaxy S8 (Exynos 8895) 10LPE 42,49 7.35 5,78 fps / W
Galaxy S7 (Exynos 8890) 14LPP 29.41 5,95 4,94 fps / W
Meizu PRO 5 (Exynos 7420) 14LPE 14.45 3.47 4,16 fps / W
Nexus 6P (Snapdragon 810 v2.1) 20Soc 21,94 5.44 4,03 fps / W
Huawei Mate 8 (Kirin 950) 16FF + 10.37 2,75 3,77 fps / W
Huawei Mate 9 (Kirin 960) 16FFC 32,49 8,63 3,77 fps / W
Huawei P9 (Kirin 955) 16FF + 10.59 2,98 3,55 fps / W

Den sista iterationen av Bifrost-arkitekturen, Mali-G76, var ett mer betydelsefullt hopp för Arm och IP kunde till stor del lösa några av de kritiska frågorna från sina föregångare, vilket resulterade i relativt bra resultat för Exynos 9820 och Kirin 980-chipsets.

Tyvärr medan Arm hämtade och fixade Bifrosts problem höll tävlingen inte bara stilla och pressade kuvertet. Qualcomms Adreno GPU-arkitektur hade ledt mobillandskapet i flera år nu, och även om Adreno 640 inte gjorde lika imponerande förbättringar i år, är det fortfarande klart ledande Arm när det gäller prestanda, effektivitet och densitet. Mer oroväckande är det faktum att Apples GPU i A12 var ett absolut stort hopp när det gäller prestanda och effektivitet, och presterade massivt bättre än till och med Qualcomms bästa, för att inte tala om Arms egna Mali-grafikprocessorer.

Introduktion till Valhall – En stor modernisering

Idag kommer vi att täcka Arms helt nya GPU-arkitektur: Valhall (anglicerad version av den gamla norska Valhöll, aka Valhalla). Den nya arkitekturen ger en helt ny ISA och beräkningskärndesign som försöker åtgärda de stora bristerna i Bifrost-arkitekturen, och ser ut att likna mycket mer de designmetoder som vi såg använde av andra GPU-leverantörer.

Den första iteration av Valhall GPU är den nya Mali-G77 som kommer att implementera alla de arkitektoniska och mikroarkitektoniska förbättringar som vi kommer att diskutera idag.

Vad som lovas är en 30-procentig ökning av energieffektivitet samt areatäthet (vid ISO-prestanda och process) och en 60-procentig ökning av prestanda för maskininlärning som inferenserar arbetsbelastningar på GPU: n.

Mer intressant är att kommande SoC-enheter i slutet av 2019 och 2020 förväntas se en prestationsökning på 40% jämfört med 2019-enheter. Nästa generations SoC: er beräknas ha endast mindre processnodförbättringar, så de flesta av de vinster som anges här beror på de arkitektoniska och mikroarkitektoniska sprången som gjorts av den nya Mali-G77 GPU.

0 Shares