01:08 EDT – Time for Power10! Bill Starke och Brian Thompto
01:09 EDT – Bill är chefarkitekt för POWER10
01:09 EDT – Brian är chefsarkitekt
01:09 EDT – Power roadmap – power handlar om företaget
01:09 EDT – Det är byggstenen för världens mest kraftfulla superdatorer
13:10 EDT – Finansiella system, kommersiella, hälso- och sjukvård, regeringar
13:10 EDT – Power10 är smartare för alla
13:10 EDT – Första hårdvaran tillbaka i varven
13:10 EDT – På väg att leverera system om 12 månader
01:10 EDT – Nya förmågor, grundläggande omarkitektur för energieffektivitet
13:10 EDT – mognat AI-landskap
01:11 EDT – AI-acceleration i processorkärnan
01:11 EDT – Integrering i företagets arbetsflöden
01:11 EDT – 18B transistorer på Samsung 7nm, 602B transistorer
01:11 EDT – Två versioner av kärnan: SMT4 och SMT8. Detta chip är SMT8-versionen
01:12 EDT – 16 fysiska kärnor, men 15 aktiveras. Förbättrar avkastningsekonomin
01:12 EDT – PHY med hög bandbredd, OMI och PowerAXON och PCIe G5
01:12 EDT – Två förpackningsalternativ: Enstaka och dubbla chipmoduler
01:12 EDT – SCM möjliggör 16-uttag, DCM är 4-uttag
01:12 EDT – Dual chip-modul är två 602 mm2 chips i ett paket
13:13 EDT – 16-uttag för stora järnsystem
01:13 EDT – PowerAXON och OMI stöder 1 TB / sek vardera
13:13 EDT – 150 mikron stötar
01:13 EDT – optimerad placering för förpackningar
01:14 EDT – PowerAXON är för chip-till-chip-anslutning
01:14 EDT – Flera nya skalningsfunktioner
01:14 EDT – OMI är OpenCAPI-minnesgränssnitt
01:14 EDT – Barnbarn till Centaur-minne
01:15 EDT – Tech agnostic – stöder alla medier med OMI-buffert
01:15 EDT – Stöder DDR4 med 410 GB / sek bandbredd per Power10 CPU
01:15 EDT – Stöder DDR5 när DDR5 är redo – inget nytt system, behöver bara ett nytt OMI-buffertchip
13:15 EDT – Stöder också GDDR i upp till 800 GB / sek
01:16 EDT – Stöder också minne på lagringsklass upp till 2 TB
01:16 EDT – PowerAXON stöder SCM eller ASIC / FPGA med direktkoppling
01:17 EDT – Memory Inception kommer till Power10 – få åtkomst till minne från valfritt uttag i klustret
01:17 EDT – Full maskinvarubelastning / lagringsåtkomst till annat serverminne
01:17 PM EDT – Endast + 150ns jämfört med åtkomst till långt minne inom samma server
01:18 EDT – Stöder upp till 2 PB minne
01:18 EDT – Anslut flera 16-uttagssystem med Memory Inception
01:18 EDT – Eller servrar utan minneslån från en stor server
01:19 EDT – Personsökningstabeller som routingtabeller
01:19 EDT – Robust virtuell kanalhantering
01:19 PM EDT – Tillåter 1000-tal noder att komma åt minne i hela systemet
01:19 EDT – Sammanställning av minnesresurs på podnivå med extra växel
01:19 EDT – Minnesuppdelning blir verklighet.
01:19 EDT – Även 64 banor med PCIe G5
01:20 EDT – 2.2-4.4x sockelprestanda jämfört med Power9
01:20 EDT – * 602mm2, korrigering från tidigare
01:21 EDT – Upp till 8 trådar per kärna
01:21 EDT – + 30% genomsnittlig perf mot POWER9, + 20% i ST
01:21 EDT – 2,6x perf / watt förbättring
01:21 EDT – DCM är effektivare
01:22 EDT – I SMT8-läge, 15 kärnor per chip. I SMT4-läge, 30 kärnor per chip
01:22 EDT – Core är modulärt
01:22 EDT – Containerbaserat stackstöd över PowerVM hypervisor
01:23 EDT – Högpresterande kapslade hypervisorer med förbättrad säkerhet
01:23 EDT – Power ISA 3.1
01:23 EDT – 64-bitars prefixinstruktioner i en RISC-vänlig borta
01:23 EDT – Nytt op-kodutrymme för instruktionsinstruktion
01:24 EDT – Optimeringar för minnesnivåer
01:24 EDT – Säkerhet och isolering
01:24 EDT – Crypto perf för framtida algoritmer accelererade redan
01:24 EDT – Säkra behållare som stöds i hårdvaru- och virtualiseringslager
01:24 EDT – Full minneskryptering
01:25 EDT – Aktiv hantering för förbättrad prestanda och undviker sidokanal
01:25 EDT – Här är ett kärndiagram – det här är en halv SMT8-kärna
01:25 EDT – Varje SMT4-segment kan göra 2x512b och 4x128b per cykel
01:26 EDT – 4x i blandad matematikacceleration
01:26 EDT – 1,5x L1-cache, 4x L2, 4x TLB
01:26 EDT – 1000 instruktioner i flygning per SMT8-kärna
01:26 EDT – L2 är 13,5 cykel
01:26 EDT – L2 är 13,5 cykel
01:26 EDT – L3 är 27,5 cykel
01:26 EDT – Nya taggförutsägare
01:26 EDT – Körningen av filialen har förbättrats
01:27 EDT – Nya instruktionsfusionsmöjligheter
01:27 EDT – Eliminerar beroenden
01:27 EDT – Säkringsinstruktioner i följd / lagring, dubbel bred belastning / lagra kroppsvikt
01:27 EDT – Förbättrad klockgång
01:27 EDT – varje designelement designades om för prestanda och effektivitet
01:28 EDT – Omformade större strukturer som köer
01:28 EDT – 1,3x perf vid 0,5x effekt mot Power9
01:28 EDT – = 2,6x perf / watt totalt på kärnnivån
01:28 EDT – 3x perf / watt vid uttagsnivå
01:29 EDT – Också förbättrad minnesbandbredd
01:29 EDT – 2x byte från alla källor: L1, L2, L3, OMI
01:29 EDT – 4x 32B-belastningar, 2x 32B-butiker per SMT8-kärna (Fusion krävs)
01:29 EDT – OMI till en kärna – 256 GB / sek topp, 120 GB / s ihållande, 3x L3 prefetch och mem prefetch extensions
13:30 EDT – 8 SIMD 128-bitars motorer per SMT8-kärna
13:30 EDT – stöder fast, flyter, permuterar
13:30 EDT – 4 512b-motorer per SMT8-kärna
13:30 EDT – stöder FP64, FP32, FP16, BF16, INT16, INT8, INT4
01:31 EDT – Ny MMA-förbättrad infernece-acceleration
01:32 EDT – Enkel biblioteksuppdatering behövs i de flesta fall
01:32 EDT – Implementerar effektivitet för återanvändning av data
01:32 EDT – 3x minskning av latensens inferens
01:32 EDT – Förbättringar över POWER9
01:33 EDT – Tidsskala för Power10 är att initiala system för IBM-partners kommer att finnas tillgängliga Q4 2021
01:33 EDT – (IBM brukar göra detta – meddela en kärna / produkt 12 månader i förväg)
01:33 EDT – För att göra det möjligt för kunder och utvecklare att anpassa sig
01:34 EDT – Q & A-tid
01:35 EDT – F: PCIe Gen6? Kommer framtida Power10 att möjliggöra detta? S: Inget tal om våra framtida produkter. Vi är glada att PCIe påskyndar, vi tittar alltid på marknadsförhållandena för att skapa marker.
01:36 EDT – F: Läs latensökning med OMI DIMM? A: mindre än + 10ns
01:37 PM EDT – F: Uppgraderades kraftleveransen eller var de fortfarande LDO: er? S: Gå in på ISSCC. Fortfarande liknande leveransplattform för Power9
01:39 EDT – F: Fungerar POWER och z tillsammans? A: Ja, hela tiden. Peer review varandra. Vi får frågor om bågskillnader – varje produkt passar för varje kundbas. Extremt motiverat. Vi gör peer review, så vi blir experter på båda. Vi delar också IP, som OMI, liksom andra funktioner. Även fysisk design etc. Massor av synergi, men också många skillnader
01:39 EDT – Det är en wrap. Nästa samtal är ThunderX3 från Marvell