03:41 EDT – ARM:s första forskningstoppmöte äger rum idag på Churchill College, Cambridge. Vi har säten nära främre raden och förväntar oss lite detaljer om framtida HPC-planer idag.
03:42 EDT – Inledande kommentarer från predikstolen: SoftBank-förvärvet innebär business as usual
03:42 EDT – Dessutom, “Brexit betyder Brexit”, men ARM är multinationellt och tilldelas fortfarande EU-medel för projekt.
03:44 EDT – Eric van Hensbergen först ut
03:45 EDT – Han var först involverad i 2002 års Earth Simulatior, 35.6 TF, 640 noder
03:45 EDT – Även involverad i Roadrunner, första PF-maskinen 2008, gick sedan med i ARM 2012 för att leda Exascale-programmet
03:46 EDT – Han är chef för HPC
03:47 EDT – Redan 2012 var ARM med 64 kärnor ett “monsterprojekt”, från Phytium. Realiserade 2015 med Mars med 64 “Xiaomi”-kärnor
03:49 EDT – Mont-Blanc-projektet, ser vad som kan göras med nuvarande ARM-kärnor med Barcelona Supercomputing Centre. Baserad på Exynos (A15) med Mali-T604
03:51 EDT – Diskuterar big.Little med HPC
03:51 AM EDT – I vissa fall är många små kärnor bättre för SoC snarare än stora tjocka.
03:53 AM EDT – Simulerad energiavdelningens arbetsbelastning via PCA för HPC, med mikroarkitekturanalys (PCA)
03:53 AM EDT – Vissa arbetsbelastningar är core-, L1-, L2-, L3- eller DRAM-beroende – avgörande för att se vilka kärndesigner som är meningsfulla
03:54 EDT – Många arbetsbelastningar var cache-känsliga, över kärna-känsliga, och diagrammet visar detta
03:55 AM EDT – Skalbara vektortillägg (det nya tillkännagivandet) var ett resultat av input från denna testning och partners som Cray och Fujitsu
03:56 EDT – Neon var inte tillräckligt, det var mer DSP-fokuserat. Därför skapades SVE
03:56 EDT – Vi såg att många arbetsbelastningar pressade ut vektorlängder, så istället för att designa om uArch vartannat år, gör en agnostisk design
03:57 AM EDT – SVE är en valfri del av den licensierade ARMv8-A-arkitekturen
03:58 EDT – Bortsett från SVE är flaskhalsar i minne och cache frustrerande. Arbetar med Sandia National Labs och DoE för att ta itu med detta problem genom ny teknik
03:59 EDT – Lenovo-servrar med Cavium utplacerat i Storbritannien var de första HPC ARM-kärnorna som levererades. 1152 64-bitars ARM-kärnor i 6U
04:00 EDT – Designcenter i Manchester (UK) för att fokusera på verktyg/bibliotek och körtider för ARM HPC-stöd i kommersiellt
04:04 EDT – Portering av OpenHPC-paket för ARM
04:05 EDT – ARM är en silvermedlem i OpenHPC
04:06 EDT – För närvarande vid 131/166 porterade paket
04:06 EDT – Medlem av många internationella standarder – HSA, JEDEC, OpenSHMEM, CCIX, OpenCompute, OpenMP, HMC Consortium
04:06 EDT – “Några av konkurrenterna konsoliderar aspekterna av datoranvändning i sin portfölj – ARM handlar om att uppmuntra mångfald och konkurrens”
04:07 EDT – “Vi vill testa verkliga arbetsbelastningar så att vi kan ställa in våra allmänna arkitekturer mot vad människor står inför”
04:08 AM EDT – “Du vill att Exascale ska användas i stor utsträckning och kan användas för det bredaste utbudet av applikationer”
04:08 AM EDT – “Dataanalys, för design och tillämpning, är ett viktigt område vi fokuserar på”
04:08 EDT – Ett antal kinesiska partner fokuserar mycket på HPC, det fanns sex stammar som följdes och nu nere till tre som ska utvecklas under 2017
04:08 AM EDT – Även inbäddad HPC, nästa generations processorer för rymden
04:09 EDT – Dedikerade HPC-verktyg för ARM är alla online. Bygga communityn över tid, användargruppsmöten mm
04:14 EDT – Steve Furber, ICL-professor i datateknik, University of Manchester
04:14 AM EDT – SpiNNaker-projektet har diskuterats i 20 år, utvecklat under de senaste 10
04:14 EDT – Problemet är förmågan att simulera en hjärna
04:14 EDT – Del av EU:s stora hjärnprojekt
04:15 AM EDT – “Simulering av en hjärna kan hjälpa många vanliga problem på många områden”
04:16 AM EDT – Aktuella uppskattningar för att köra en mänsklig hjärnmodell i realtid kräver ett system efter Exascale
04:17 EDT – Det är klart att det tar tiotals megawatt, och den mänskliga hjärnan använder 20W eller så
04:17 EDT – Omvänt kan inte en hjärna simulera en dator heller.
04:18 AM EDT – Hjärnor är jämförelsevis långsamma, gör saker i storleksordningen en millisekund, inte nanosekunder
04:18AM EDT – De mest effektiva kärnorna tenderar att vara de som gör minst arbete
04:18 EDT – Hjärnan är mycket bra för feltolerans
04:21 EDT – The Human Brain-projektet är ett huvudprojekt för EU:s flaggskepp, rubrik 1b euro budget över 10 år. eller 100m/år för 120 institutioner
04:21 AM EDT – Frågor om Brexit är okända för nu
04:22 EDT – Om du undrar vad hjärnor har att göra med ARM HPC, är det som ett stort färdplansmål inom datoranvändning i allmänhet, så ARM vill spela en roll
04:22 EDT – Därför är det en stor del av denna Keynote
04:23 AM EDT – “Förvandla den högpresterande datorn till något du kan interagera med eftersom den har en “hjärna”
04:24 AM EDT – Ett problem med en miljon ARM SoCs, nätverkstopologi är komplex och skalbarhet är ett problem
04:25 EDT – En mus är 1/1000 av en mänsklig hjärna, så det är ett mellanmål
04:26 AM EDT – Applicera datorbaserad mushjärna på en musrobot, och om resultatet gillar ost, är det en kryssad ruta
04:27 EDT – “Du kopplar bort nätverkets topologi från topologin för vad du behöver.”
04:28 AM EDT – ‘Du kopplar bort nätverkets topologi från topologin för vad du behöver.’
04:28 EDT – ‘Tiden modellerar sig själv och det hela körs asynkront. Processorer måste klara sig’
04:28AM EDT – Spinnaker-chip använder en kärna och LPDDR-minne från Micron i ett 2.5D-paket
04:29 EDT – Denna paketmetod sparar 15 % ström
04:30 EDT – 18 ARM968-kärnor i ett chip, vid 130nm
04:30 AM EDT – ARM968, eftersom det är billigt. DRAM är 1 mm från processorn
04:31 EDT – Minnet är scratchpad, inte cachar
04:32 EDT – Paketväxlingsroutern är den viktigaste dataöverföringspunkten
04:32AM EDT – Routern är nyckelinnovationen i spinnaker för neurala nätverk i realtid
04:34 AM EDT – Routern visar processortoppar och var spikar måste resa till. 3-stats innehållsadresserbar associativ tabell
04:34 EDT – 1 inkommande paket kan bli 24 utgående paket, beroende på tabellkonfiguration
04:34 AM EDT – ‘Du kopplar bort nätverkets topologi från topologin för vad du behöver.’
04:35 EDT – skicka paketet ASAP, vilket hårdvaran uppnår
04:36 AM EDT – SpiNNaker kommer att användas av icke-ARM-guruer, så SDK:er och kodningshierarki tillhandahålls
04:38 EDT – Uppenbarligen är detta ett universitetsprojekt, så budgetarna är låga. Därav ARM968, snarare än att säga A53
04:39 AM EDT – 20k kärnmaskin kräver 2kW
04:39 EDT – 100 000 kärnor vid 10 kW, klarade av 5 kW, tomgång mycket lägre
04:41 EDT – Human Brain Project-plattformen använder 500 000 kärnor, 6 skåp och alla akademiker kan använda den.
04:44 EDT – Spinnaker använder 10nanojoule per spikanslutning. Människans hjärna är 10 femtojoule, BlueGene är cirka 1 Joule
04:45 EDT – Prof Furber utvecklade en Sudoku-lösare i 36400 neuroner, löser vilken sudoku som helst på 10 sekunder. Exempelprojekt
04:47 AM EDT – Tredje delen av Keynote, som handlar om cache- och minnesdesign för HPC för 2020-2030
04:50 AM EDT – Behöver tänka om minnet, massor av chiputrymme är dedikerat till minne
04:51 EDT – Det här föredraget är högt tempo med massor av bilddetaljer. Jag kan ta till en hel del bilder här