Anslut till Senaste Tekniska Nyheter, Bloggar, Recensioner

Arm tillkännager mobil Armv9 CPU-mikroarkitektur: Cortex-X2, Cortex-A710 & Cortex-A510

Det är den tiden på året igen, och efter förra månadens avtäckande av Arms nyaste infrastruktur Neoverse V1 och Neoverse N2 CPU IPs, är det nu dags att täcka klient- och mobilsidan av saken. I år skakar saker Arm om saker och ting lite mer än vanligt eftersom vi ser tre nya generationens mikroarkitekturer för mobil och klient: flaggskeppet Cortex-X2-kärnan, en ny A78-efterföljare i form av Cortex-A710, och för första gången på flera år, en helt ny liten kärna med nya Cortex-A510. De tre nya CPU:erna bildar en ny trio av Armv9-kompatibla konstruktioner som syftar till att markera ett större arkitektoniskt/ISA-skifte som kommer mycket sällan i branschen.

Vid sidan av de nya CPU-kärnorna ser vi också en ny L3- och klusterdesign med DSU-110, och Arm gör också en stor uppgradering av sin interconnect IP med det nya cache-koherenta CI-700 mesh-nätverket och NI-700-nätverket -på-chip-IP:er.

Cortex-X2, A710 och A510 följer upp förra årets X1, A78 och A55. För de nya Cortex-X2 och A710 i synnerhet är dessa direkta mikroarkitektoniska efterföljare till sina föregångare. Dessa delar, samtidigt som de upprepar generationsförbättringar i IPC och effektivitet, innehåller också helt nya arkitektoniska funktioner i form av Armv9 och nya tillägg som SVE2.

Cortex-A510, Arms nya lilla kärna, är ett större mikroarkitektoniskt hopp, eftersom den representerar en ny ren processordesign från Arm’s Cambridge CPU-designteam. A510 ger stora IPC-förbättringar samtidigt som den har ett fortsatt fokus på energieffektivitet, och, kanske mest intressant, behåller sin karakteristiska mikroarkitektoniska i ordning.

En Armv9 CPU-familj – AArch64 endast för alla praktiska ändamål*

Den nya CPU-familjen markerar ett av de största arkitektoniska hopp vi har haft på åratal, eftersom företaget nu baserar alla tre nya CPU-IP:er på Armv9.0. Vi har utförligt täckt detaljerna i den nya Arm-arkitekturen i slutet av mars. Hörnstensfunktioner i den nya ISA inkluderar den nya registreringen av tidigare valfria/saknade Armv8.2+-funktioner som inte var garanterade i mobil- och klientdesigner (mest på grund av de äldre A55-kärnorna), och introduktionen av nya SVE2 SIMD- och vektortillägg .

En stor förändring som vi har förväntat oss ganska länge nu är att vi kommer att se en utfasning av 32-bitars AArch32-exekveringsläget i kommande Arm Cortex-A-mobilkärnor. Klockan har tickat för 32-bitars appar sedan dess Google har meddelat under 2019 som Google Play Store kommer att kräva för 64-bitars appuppladdningar, och företaget kommer att sluta servera 32-bitars applikationer till 64-bitars kompatibla enheter senare i sommar

Medan Arm förklarar att förändringen kommer att ske 2023, sker det i alla avseenden redan nästa år för de flesta globala användare. Både Cortex-X2 flaggskeppskärnan och Cortex-A510 små kärnor är AArch64-bara mikroarkitekturer som inte längre kan exekvera AArch32-kod.

Med det sagt kommer skarpa läsare att notera att två av tre processorer inte är en fullständig förändring, och anledningen till det är att Cortex-A710 faktiskt fortfarande stöder AArch32. Arm uppger att anledningen till detta i första hand är för att möta behoven på den kinesiska mobilmarknaden, som saknar de homogena ekosystemmöjligheterna på de globala Play Store-marknaderna, och kinesiska leverantörer och deras inhemska appmarknad kräver lite mer tid för att underlätta skiftet mot Endast 64-bitars. Det betyder att vi kommer att ha ett udda scenario nästa år med SoCs där endast de mellersta kärnorna kan köra 32-bitars applikationer, där dessa appar förpassas till de mellersta A710-kärnorna och går miste om de små A510-kärnornas energieffektivitet eller X2-kärnornas prestanda.

På den stora kärnsidan är nya Cortex-X2 och Cortex-A710 efterföljare till Cortex-X1 och Cortex-A78. Båda designerna är mestadels designade av Arm’s Austin designteam och representerar den fjärde generationen av denna mikroarkitekturfamilj, som började med Cortex-A76 för flera år sedan. Dessa kärnor borde vara de sista i denna mikroarkitekturfamilj innan Arm lämnar över saker till en helt ny design med nästa års nya Sophia-kärnor.

När det gäller designfilosofi håller X2 och A710 i allmänhet samma övergripande mål som X1 och A78 hade definierat: X-serien fortsätter att fokusera på att förbättra prestanda genom att öka mikroarkitektoniska strukturer och genom att Arm är villig att göra kompromisser om makt inom rimliga gränser . Samtidigt fortsätter A710 att fokusera på att förbättra prestanda och effektivitet genom smartare design och med stort fokus på att maximera balansen mellan kraft, prestanda och area (PPA) för IP.

En poäng Arm påpekar i bilden ovan är att ha optimerade kritiska vägar och fysisk design för ihållande spänningsdrift – detta är mer ett mål som företaget strävar efter i nästa generationer av “mellan” kärnor snarare än något som specifikt återspeglas i Cortex -A710.

I år ser vi också äntligen en ny liten kärna. Vi hade täckt Cortex-A55 redan 2017, och sedan dess har vi inte sett några uppdateringar av Arms små kärnor, till den grad att det har setts som en stor svaghet hos de senaste generationerna av mobila SoC.

Den nya Cortex-A510 är en ren design från Arm’s Cambridge designteam, som utnyttjar många av de teknologier som hade använts i företagets större kärnor, men implementerade i en ny liten mikroarkitektur i sin ordning. Ja – vi pratar fortfarande om en kärna i ordning, och Arm ser fortfarande att detta är det bästa valet när det gäller att utvinna den bästa effektiviteten och “Användningsdagar” för mobila enheter.

Även om det är en kärna i ordning, gjorde Arm en jämförelse med att den nya designen är extremt lik en flaggskeppskärna från 2017 – nämligen Cortex-A73, som uppnår mycket liknande IPC och frekvenskapacitet samtidigt som den förbrukar mycket mindre ström.

Den nya designen kommer också med ett mycket intressant delat komplext tillvägagångssätt och delar L2- och FP/SIMD-pipelines med en andra kärna, en designmetod Arm kallar “merged core” och kommer utan tvekan att påminna läsarna om AMD:s CMT-strategi i Bulldozer-kärnor för 10 år sedan , även om det finns ganska viktiga skillnader i tillvägagångssätten.