Anslut till Senaste Tekniska Nyheter, Bloggar, Recensioner

Arm avslöjar 2023 mobila CPU-kärndesigner: Cortex-X4, A720 och A520 – Armv9.2-familjen

Över hela världen, om det finns en universell konstant på marknaden för smartphones och mobila enheter, så är det Arm. Oavsett om det är mobila chiptillverkare som baserar sina SoCs på Arms helt syntetiserade CPU-kärnor, eller bara förlitar sig på Arm ISA och designar sina egna chip, i slutet av dagen, ligger Arm bakom praktiskt taget allt. Den typen av marknadsmättnad och relevans är ett bevis på allt det hårda arbete som Arm har gjort under de senaste decennierna för att nå denna punkt, men det är också ett stort ansvar – för de flesta mobila SoC:er går deras prestanda bara framåt så snabbt som Arms egna CPU-kärndesigner och tillhörande IP gör det.

Följaktligen har vi sett Arm sätta sig in i en årlig kadens för sin klient-IP, och i år är inget undantag. Tidpunkten för att anpassa sig till årets Computex-mässa i Taiwan, visar Arm upp en ny uppsättning av Cortex-A- och Cortex-X-seriens CPU-kärnor – såväl som en ny generation av GPU-designer – som vi kommer att se bära facklan för Arm med start senare i år och in i 2024. Dessa inkluderar flaggskeppet Cortex-X4-kärnan, samt Arms mittkärna Cortex-A720. och den nya lilla kärnan Cortex-A520.

Arms senaste CPU-kärnor bygger på grunden för Armv9 och deras tidigare Total Compute Solution (TCS21/22) ekosystem. För deras 2023 IP rullar Arm ut en våg av mindre mikroarkitektoniska förbättringar genom sin Cortex-linje av kärnor med subtila förändringar utformade för att driva effektivitet och prestanda hela tiden, samtidigt som den går helt och hållet till AArch64 64-bitars instruktionsuppsättning. De senaste CPU-designerna från Arm är också utformade för att passa in i den pågående industriomfattande strävan mot förbättrad säkerhet, och även om dessa funktioner inte strikt riktar sig till slutanvändare, understryker det hur Arms generationsförbättringar är till mer än bara prestanda och kraft effektivitet.

Förutom att förfina sina CPU-kärnor har Arm genomfört en omfattande uppgradering av sitt DynamIQ Shared Unit-kärnkomplex, med DSU-120. Även om de införda modifieringarna är subtila, har de stor betydelse när det gäller att förbättra effektiviteten hos tyget som håller ihop Arm CPU-kärnor, tillsammans med att utöka Arms räckvidd ytterligare när det gäller prestandaskalbarhet med stöd för upp till 14 CPU-kärnor i ett enda block – ett drag utformat för att göra Cortex-A/X ännu bättre lämpad för bärbara datorer.

Med tre nya CPU-kärnor och ett nytt kärnkomplex finns det mycket att täcka. Så låt oss dyka direkt in.

Arma TCS23 på en hög nivå: Pushing Efficiency & Going Pure 64-bitars

Genom att utöka förbättringarna som introducerades i Armv9.1-arkitekturen förra året, går Arm framåt genom sin planerade utvecklingscykel med den senaste Armv9.2-arkitekturen. Det primära syftet med denna cykel är att eliminera stödet för 32-bitars applikationer och övergången till en omfattande 64-bitars plattform. Som stöd för denna övergång är Arms strategiska ramverk, “Total Compute Solutions” (TCS), som kretsar kring tre kärnprinciper: datorprestanda, säkerhet och utvecklaråtkomst. Detta tillvägagångssätt utgör grunden för Arms metodik och vägleder dess ansträngningar för att leverera optimal prestanda, robusta säkerhetsåtgärder och strömlinjeformade utvecklarfunktioner.

Arms fokus på att fasa ut 32-bitars instruktionsuppsättningen har varit en man har arbetat mot i flera år. För sin senaste TCS23 har de äntligen skapat ett helt 64-bitars kluster för att dra nytta av fördelarna med ett komplett 64-bitars mobilt ekosystem, uteslutande AArch32 (32-bitars instruktion) stöd helt.. Så oavsett om det är ett stort, mellan eller liten kärna, för Arms senaste generation av IP finns det bara AArch64.

Att utveckla ett dynamiskt system-on-a-chip (SoC) som tillgodoser ett brett spektrum av mobila enheter, allt från toppmoderna flaggskeppssmartphones till nybörjarmodeller, kräver en noggrann och konsekvent strategi för att upprätthålla konkurrenskraften på en snabbt växande marknad . I sfären av flaggskeppsenheter, till exempel, sticker Qualcomms Snapdragon 8 Gen2 SoC ut och utnyttjar ett kluster av Arms Cortex-X3, Cortex A715/710 och Cortex-A510 kärnor. Den kommande iterationen av Qualcomms Snapdragon 8 Gen3 och andra SoC-tillverkare är redo att utnyttja kraften i Arms TSC23-kärnkluster och immateriella rättigheter för att ytterligare förbättra prestandan i den efterföljande generationen av flaggskeppsmobilenheter.

Arms senaste DynamIQ Shared Unit, DSU-120, erbjuder stöd för upp till 14 CPU-kärnor i ett kluster, vilket öppnar dörren till ett betydande antal olika CPU-kärnkombinationer. Vi får se vad SoC-leverantörer har valt senare i år, men en konfiguration är förmodligen en 1+5+2 (X4+720+520), vilket troligen är en konfiguration för en avancerad smartphone. Jämfört med en sista generationens 1+3+4-kluster (X3+715+510), hävdar Arm en höjning på 27 % i beräkningsprestanda inom GeekBench 6 MT och en mer avsevärd höjning på mellan 33 % och 64 % i hastighetsmätaren 2.1 benchmark beroende på implementerade programvaruoptimeringar.

Med fokus mer på tillvägagångssättet för 64-bitars migrering, förra året tillkännagav Arm sin första AArch64-bara CPU-kärna, Cortex-A715. Följaktligen släpptes förra året de första 64-bitars produkterna, såsom MediaTeks Dimensity 9200 SoC, samt Googles Pixel 7 – som endast var 64-bitars som ett plattformsval snarare än en arkitektonisk begränsning.

Som sagt, den faktiska användningen/användningen av AArch64 inom det större mjukvaruekosystemet har varit långsammare än förväntat, främst på grund av att den kinesiska marknaden är långsam med att byta från 32-bitars till 64-bitars. Google har faktiskt varit nyckeln med sin applikationslagring (Google Play) genom att kräva att dess utvecklare skickar in 64-bitarsappar så långt tillbaka som 2019, samtidigt som de tillåter användning av 32-bitarsapplikationer på enheter utan inbyggt 64-bitarsstöd. Andra marknader har inte varit lika snabba med att göra det, men Arm hävdar att det “nuddar” företag som OPPO, Vivi och Xiaomi att adoptera AArch64 snabbare, vilket tros ha den önskade effekten.

Med den initiala Armv9-arkitekturen gjorde Arm förbättringar av säkerheten genom att använda sin Memory Tagging Extension (MTE) (Armv8.5), som är en hårdvarubaserad implementering som använder Pointer Authentication (PA)-tillägg för att skydda mot minnessårbarheter. Minnesbaserade sårbarheter har varit ett konsekvent hot mot hårdvarubaserad säkerhet i många år, och det är något Arm ständigt utvecklar inom sin IP för att hjälpa till att mildra dessa typer av attacker. Som referens hävdade Googles Chromium Project att cirka 70 % av de allvarliga felen kommer från minnet.

En av de relaterade säkerhetsfunktionerna i den senaste Armv9.2-arkitekturen är introduktionen av en ny QARMA3 Pointer Authentication Code (PAC) algoritm. Arm hävdar att den nyare algoritmen minskar CPU-overheaden för PAC till mindre än 1 %, även på deras små kärnor, vilket ger utvecklare och telefonleverantörer ännu mindre anledning att inte aktivera säkerhetsfunktionen. De flesta av dessa förbättringar kretsar kring hårdvaruintegritet och säkerhet, med en kombination av MTE och inbyggda fördelar genom 64-bitars instruktion och arkitektur, allt designat för att göra enheter ännu säkrare under 2023 och framåt. Detta passar med Arms etos att uppmuntra en fullständig byte till 64-bitars över en hybrid 64- och 32-bitarsmarknad.

Slutligen, när man tittar på prestanda, hävdar Arm att deras senaste generations CPU och kärnkomplexarkitektur har gjort stora vinster i energieffektivitet. Vid iso-performance erbjuder Cortex-X4 uppemot 40 % minskning av strömförbrukningen jämfört med Cortex-X3, medan Cortex-A720 och A520 sparar 20-22 % jämfört med sina respektive föregångare. På själva DSU-120-navet hävdar Arm en 18 % förbättring av energieffektiviteten.

Naturligtvis kommer de flesta av dessa energibesparingar istället att investeras i ytterligare prestanda. Men det visar vad SoC- och telefonleverantörer kan sikta på i den här generationen om de fokuserar enskilt på energieffektivitet och batteritid.