Anslut till Senaste Tekniska Nyheter, Bloggar, Recensioner

Ställa in scenen för flaggskepp Android 2020

Tidigare denna månad hade vi nöjet att delta i Qualcomms Maui-lanseringsevenemang för de nya Snapdragon 865 och 765 mobilplattformarna. De nya chipsetsen lovar att ge många nya uppgraderingar när det gäller prestanda och funktioner, och utan tvekan kommer det att vara det kisel som de allra flesta av flaggskeppsapparaten 2020 kommer att basera sin design på. Vi har täckt de nya förbättringarna och förändringarna av den nya chipset i vår dedikerade lanseringsartikel, så se till att läsa den delen om du inte är bekant med Snapdragon 865.

Som till synes har blivit en tradition med Qualcomm, efter lanseringsevenemanget har vi fått möjlighet att ha lite praktisk tid med företagets referensenheter och fått chansen att köra telefonerna genom vår riktmärke. QRD865 är en referentstelefon tillverkad av Qualcomm och integrerar det nya flaggskeppschipet. Enheten ger inblick i vad vi kan förvänta oss av kommersiella enheter 2020, och dagens artikel fokuserar särskilt på prestandaförbättringarna för den nya generationen.

En snabb sammanfattning av Snapdragon 865 om du inte har läst den mer ingående granskningen av ändringarna:

Qualcomm Snapdragon Flagship SoCs 2019-2020
SoC

Snapdragon 865

Snapdragon 855
CPU 1x cortex A77
@ 2,84 GHz 1x512KB pL2

3x cortex A77
@ 2,42 GHz 3x256KB pL2

4x Cortex A55
@ 1,80 GHz 4×128 kB pL2

4 MB sL3 @ ? MHz

1x Kryo 485 Guld (A76-derivat)
@ 2.84GHz 1x512KB pL2

3x Kryo 485 Gold (A76-derivat)
@ 2,42 GHz 3×256 kB pL2

4x Kryo 485 Silver (A55-derivat)
@ 1,80 GHz 4×128 kB pL2

2MB sL3 @ 1612MHz

GPU Adreno 650 @ 587 MHz

+ 25% perf
+ 50% ALU
+ 50% pixel / klocka
+ 0% texlar / klocka

Adreno 640 @ 585 MHz
DSP / NPU Hexagon 698

15 TOPPAR AI
(Total CPU + GPU + HVX + Tensor)

Hexagon 690

7 TOPS AI
(Total CPU + GPU + HVX + Tensor)

Minne
Kontroller
4x 16-bitars CH

@ 2133MHz LPDDR4X / 33.4GB / s
eller
@ 2750MHz LPDDR5 / 44,0 GB / s

3 MB systemnivå cache

4x 16-bitars CH

@ 1866MHz LPDDR4X 29,9 GB / s

3 MB systemnivå cache

ISP / kamera Dubbel 14-bitars Spectra 480 ISP

1x 200MP

64MP ZSL eller 2x 25MP ZSL

4K-video och 64MP burst capture

Dual 14-bitars Spectra 380 ISP

1x 192MP

1x 48MP ZSL eller 2x 22MP ZSL

Koda/
Avkoda
8K30 / 4K120 10-bitars H.265

Dolby Vision, HDR10 +, HDR10, HLG

720p960 oändlig inspelning

4K60 10-bitars H.265

HDR10, HDR10 +, HLG

720p480

Integrerat modem ingen
(Endast ihopkopplad med extern X55)

(LTE Kategori 24/22)

DL = 2500 Mbps
7x20MHz CA, 1024-QAM
UL = 316 Mbps
3x20MHz CA, 256-QAM

(5G NR Sub-6 + mmWave)
DL = 7000 Mbps
UL = 3000 Mbps

Snapdragon X24 LTE
(Kategori 20)

DL = 2000 Mbps
7x20MHz CA, 256-QAM, 4×4

UL = 316 Mbps
3x20MHz CA, 256-QAM

Mfc. Bearbeta TSMC
7nm (N7P)
TSMC
7nm (N7)

Snapdragon 865 är en efterträdare till Snapdragon 855 förra året, och representerar därmed Qualcomms senaste flaggskeppsuppsättning som erbjuder den senaste IP-tekniken. På CPU-sidan har Qualcomm integrerat Arms senaste Cortex-A77 CPU-kärnor, som ersätter den A76-baserade IP-enheten från förra året. I år har Qualcomm beslutat att inte begära några mikroarkitektoniska ändringar av IP, så till skillnad från de semi-anpassade Kryo 485 / A76-baserade processorerna som hade några olika aspekter på designen, representerar den nya A77 i Snapdragon 865 standard IP-konfigurationen som Arm erbjudanden.

Klockfrekvenser och kärncache-konfigurationer har inte förändrats i år – det finns fortfarande en enda “Prime” A77 CPU-kärna med 512 kB-cache som körs med högre 2,84 GHz och tre “Performance” eller “Guld” -kärnor med minskade 256 kB-cacher vid lägre 2,42 GHz. De fyra små kärnorna förblir A55s, och också samma cache-konfiguration som 1,8 GHz-klockan. L3-cachen i CPU-klustret har fördubblats från 2 till 4 MB. I allmänhet kommer Qualcomms annonserade 25% prestandahöjning på CPU-sidan enbart från IPC-ökningarna av de nya A77-kärnorna.

GPU i år har en uppdatering Adreno 650 design som ökar ALU och pixel rendering enheter med 50%. Slutresultatet när det gäller prestanda är en utlovad 25% uppgradering – det är troligt att företaget kör det nya blocket med en lägre frekvens än vad vi har sett på Snapdragon 855, även om vi inte kommer att kunna bekräfta detta tills vi har tillgång till kommersiella enheter i början av nästa år.

En stor prestandauppgradering på det nya chipet är fyrdubblingen av processorkraften för de nya Tensor-kärnorna i Hexagon 698. Qualcomm annonserar 15 TOPS-genomströmning för alla beräkningsblock på SoC och vi uppskattar att de nya Tensor-kärnorna ungefär representerar 10 TOPS ut av den siffran.

I allmänhet lovar Snapdragon 865 att vara ett mycket mångsidigt chip och kommer med många nya förbättringar – särskilt 5G-anslutning och nya kamerafunktioner lovas att vara nyckelfunktionerna i nya SoC. Dagens fokus ligger enbart på chipets prestanda, så låt oss gå vidare till våra första testresultat och analys.

Nya minneskontroller och LPDDR5: En stor förbättring

En av de större förändringarna i SoC denna generation var integrationen av en ny hybrid LPDDR5 och LPDDR4X minneskontroll. På QRD865-enheten har vi testat att chipet var naturligt utrustat med den nya LP5-standarden. Qualcomm minskade faktiskt vikten av LP5 i sig: den nya standarden ger högre minneshastigheter som ger bättre bandbredd, men latens bör vara densamma och fördelar med energieffektivitet, medan det finns, bör inte överspelas. Ändå hävdade Qualcomm att de fokuserade mer på att förbättra sina minneskontrollanter, och i år ser vi äntligen det nya chipet ta itu med några av de svagheter som de senaste två generationerna uppvisat; minnesfördröjning.

Vi hade kritiserat Qualcomms Snapdragon 845 och 855 för att ha ganska dålig minneslatens – ända sedan företaget hade introducerat sin systemnivå cachearkitektur till designen, hade denna aspekt av minnessubsystemet sett några ganska mediokra egenskaper. Det har varit många argument om hur mycket detta faktiskt påverkade prestanda, med Qualcomm själva som naturligtvis bagatelliserar skillnaderna. Arm noterar i allmänhet 1% prestandaskillnad för varje 5ns latens till DRAM, om skillnaderna är stora kan det summera till en märkbar skillnad.


()

Tittar vi på nya Snapdragon 865, det första som dyker upp när man jämför de två latensdiagrammen är det fördubblade L3-cachen för det nya chipet. Det bör noteras att det ser ut att det fortfarande finns någon form av logisk partitionering pågår och 512 kB av cacheminnet kan ägnas åt de små kärnorna, eftersom slumpmässiga åtkomstlatenser börjar öka med 1,5 MB för S855 och 3,5 MB för S865.

Längre ner i de djupare minnesregionerna ser vi några mycket stora förändringar i latens. Qualcomm har kunnat raka av sig cirka 35 år i det fullständiga slumpmässiga åtkomsttestet, och vi uppskattar att chipets strukturella latens nu faller in på ~ 109ns – en 20ns-förbättring jämfört med sin föregångare. Även om det i sig är mycket bra förbättringar är det fortfarande något bakom designen av HiSilicon, Apple och Samsung. Så även om Qualcomm fortfarande är den sista i gänget när det gäller dess delsystem, är det inte längre bakom med en så stor marginal. Kom ihåg resultaten från Kirin 990 här när vi går in i mer detaljerad analys av minnesintensiva arbetsbelastningar i SPEC på nästa sida.

Det som är mycket intressant med Qualcomms resultat i DRAM-regionen är dessutom beteendet hos TLB + CLR Trash-testet. Detta test slår alltid på samma cache-rad inom en sida över olika, vilket tvingar en cache-radersättning. Konstigheten här är att Snapdragon 865 här beter sig väldigt annorlunda än 855, med resultaten som visar ett separat “steg” i resultaten mellan 4MB och ~ 32MB. Detta resultat är mer av en artefakt av testet som bara träffar en enda cachelinje per sida snarare än att chipet faktiskt har någon sorts 32 MB dold cache. Min teori är att Qualcomm har gjort någon form av optimering av policyn för ersättning av cachelinjen på minnesstyrenhetsnivå, och i stället testet som träffar DRAM, ligger det faktiskt på SLC-cachen. Det är ett mycket intressant resultat och hittills är det den första och enda chipset som uppvisar ett sådant beteende. Om det verkligen är SLC, skulle latensen falla in vid cirka 25-35ns, med den icke-enhetliga latensen sannolikt ett resultat av de fyra cacheskivorna som är avsedda för de fyra minneskontrollerna.

Sammantaget ser det ut som Qualcomm har gjort ganska stora förändringar i minnessubsystemet i år, och vi ser fram emot att se effekten på prestanda.