Anslut till Senaste Tekniska Nyheter, Bloggar, Recensioner

ARM Research Summit 2016 Keynote Live Blog

03:41 EDT – ARM:s första forskningstoppmöte äger rum idag på Churchill College, Cambridge. Vi har säten nära främre raden och förväntar oss lite detaljer om framtida HPC-planer idag.

03:42 EDT – Inledande kommentarer från predikstolen: SoftBank-förvärvet innebär business as usual

03:42 EDT – Dessutom, “Brexit betyder Brexit”, men ARM är multinationellt och tilldelas fortfarande EU-medel för projekt.

03:44 EDT – Eric van Hensbergen först ut

03:45 EDT – Han var först involverad i 2002 års Earth Simulatior, 35.6 TF, 640 noder

03:45 EDT – Även involverad i Roadrunner, första PF-maskinen 2008, gick sedan med i ARM 2012 för att leda Exascale-programmet

03:46 EDT – Han är chef för HPC

03:47 EDT – Redan 2012 var ARM med 64 kärnor ett “monsterprojekt”, från Phytium. Realiserade 2015 med Mars med 64 “Xiaomi”-kärnor

03:49 EDT – Mont-Blanc-projektet, ser vad som kan göras med nuvarande ARM-kärnor med Barcelona Supercomputing Centre. Baserad på Exynos (A15) med Mali-T604

03:51 EDT – Diskuterar big.Little med HPC

03:51 AM EDT – I vissa fall är många små kärnor bättre för SoC snarare än stora tjocka.

03:53 AM EDT – Simulerad energiavdelningens arbetsbelastning via PCA för HPC, med mikroarkitekturanalys (PCA)

03:53 AM EDT – Vissa arbetsbelastningar är core-, L1-, L2-, L3- eller DRAM-beroende – avgörande för att se vilka kärndesigner som är meningsfulla

03:54 EDT – Många arbetsbelastningar var cache-känsliga, över kärna-känsliga, och diagrammet visar detta

03:55 AM EDT – Skalbara vektortillägg (det nya tillkännagivandet) var ett resultat av input från denna testning och partners som Cray och Fujitsu

03:56 EDT – Neon var inte tillräckligt, det var mer DSP-fokuserat. Därför skapades SVE

03:56 EDT – Vi såg att många arbetsbelastningar pressade ut vektorlängder, så istället för att designa om uArch vartannat år, gör en agnostisk design

03:57 AM EDT – SVE är en valfri del av den licensierade ARMv8-A-arkitekturen

03:58 EDT – Bortsett från SVE är flaskhalsar i minne och cache frustrerande. Arbetar med Sandia National Labs och DoE för att ta itu med detta problem genom ny teknik

03:59 EDT – Lenovo-servrar med Cavium utplacerat i Storbritannien var de första HPC ARM-kärnorna som levererades. 1152 64-bitars ARM-kärnor i 6U

04:00 EDT – Designcenter i Manchester (UK) för att fokusera på verktyg/bibliotek och körtider för ARM HPC-stöd i kommersiellt

04:04 EDT – Portering av OpenHPC-paket för ARM

04:05 EDT – ARM är en silvermedlem i OpenHPC

04:06 EDT – För närvarande vid 131/166 porterade paket

04:06 EDT – Medlem av många internationella standarder – HSA, JEDEC, OpenSHMEM, CCIX, OpenCompute, OpenMP, HMC Consortium

04:06 EDT – “Några av konkurrenterna konsoliderar aspekterna av datoranvändning i sin portfölj – ARM handlar om att uppmuntra mångfald och konkurrens”

04:07 EDT – “Vi vill testa verkliga arbetsbelastningar så att vi kan ställa in våra allmänna arkitekturer mot vad människor står inför”

04:08 AM EDT – “Du vill att Exascale ska användas i stor utsträckning och kan användas för det bredaste utbudet av applikationer”

04:08 AM EDT – “Dataanalys, för design och tillämpning, är ett viktigt område vi fokuserar på”

04:08 EDT – Ett antal kinesiska partner fokuserar mycket på HPC, det fanns sex stammar som följdes och nu nere till tre som ska utvecklas under 2017

04:08 AM EDT – Även inbäddad HPC, nästa generations processorer för rymden

04:09 EDT – Dedikerade HPC-verktyg för ARM är alla online. Bygga communityn över tid, användargruppsmöten mm

04:14 EDT – Steve Furber, ICL-professor i datateknik, University of Manchester

04:14 AM EDT – SpiNNaker-projektet har diskuterats i 20 år, utvecklat under de senaste 10

04:14 EDT – Problemet är förmågan att simulera en hjärna

04:14 EDT – Del av EU:s stora hjärnprojekt

04:15 AM EDT – “Simulering av en hjärna kan hjälpa många vanliga problem på många områden”

04:16 AM EDT – Aktuella uppskattningar för att köra en mänsklig hjärnmodell i realtid kräver ett system efter Exascale

04:17 EDT – Det är klart att det tar tiotals megawatt, och den mänskliga hjärnan använder 20W eller så

04:17 EDT – Omvänt kan inte en hjärna simulera en dator heller.

04:18 AM EDT – Hjärnor är jämförelsevis långsamma, gör saker i storleksordningen en millisekund, inte nanosekunder

04:18AM EDT – De mest effektiva kärnorna tenderar att vara de som gör minst arbete

04:18 EDT – Hjärnan är mycket bra för feltolerans

04:21 EDT – The Human Brain-projektet är ett huvudprojekt för EU:s flaggskepp, rubrik 1b euro budget över 10 år. eller 100m/år för 120 institutioner

04:21 AM EDT – Frågor om Brexit är okända för nu

04:22 EDT – Om du undrar vad hjärnor har att göra med ARM HPC, är det som ett stort färdplansmål inom datoranvändning i allmänhet, så ARM vill spela en roll

04:22 EDT – Därför är det en stor del av denna Keynote

04:23 AM EDT – “Förvandla den högpresterande datorn till något du kan interagera med eftersom den har en “hjärna”

04:24 AM EDT – Ett problem med en miljon ARM SoCs, nätverkstopologi är komplex och skalbarhet är ett problem

04:25 EDT – En mus är 1/1000 av en mänsklig hjärna, så det är ett mellanmål

04:26 AM EDT – Applicera datorbaserad mushjärna på en musrobot, och om resultatet gillar ost, är det en kryssad ruta

04:27 EDT – “Du kopplar bort nätverkets topologi från topologin för vad du behöver.”

04:28 AM EDT – ‘Du kopplar bort nätverkets topologi från topologin för vad du behöver.’

04:28 EDT – ‘Tiden modellerar sig själv och det hela körs asynkront. Processorer måste klara sig’

04:28AM EDT – Spinnaker-chip använder en kärna och LPDDR-minne från Micron i ett 2.5D-paket

04:29 EDT – Denna paketmetod sparar 15 % ström

04:30 EDT – 18 ARM968-kärnor i ett chip, vid 130nm

04:30 AM EDT – ARM968, eftersom det är billigt. DRAM är 1 mm från processorn

04:31 EDT – Minnet är scratchpad, inte cachar

04:32 EDT – Paketväxlingsroutern är den viktigaste dataöverföringspunkten

04:32AM EDT – Routern är nyckelinnovationen i spinnaker för neurala nätverk i realtid

04:34 AM EDT – Routern visar processortoppar och var spikar måste resa till. 3-stats innehållsadresserbar associativ tabell

04:34 EDT – 1 inkommande paket kan bli 24 utgående paket, beroende på tabellkonfiguration

04:34 AM EDT – ‘Du kopplar bort nätverkets topologi från topologin för vad du behöver.’

04:35 EDT – skicka paketet ASAP, vilket hårdvaran uppnår

04:36 AM EDT – SpiNNaker kommer att användas av icke-ARM-guruer, så SDK:er och kodningshierarki tillhandahålls

04:38 EDT – Uppenbarligen är detta ett universitetsprojekt, så budgetarna är låga. Därav ARM968, snarare än att säga A53

04:39 AM EDT – 20k kärnmaskin kräver 2kW

04:39 EDT – 100 000 kärnor vid 10 kW, klarade av 5 kW, tomgång mycket lägre

04:41 EDT – Human Brain Project-plattformen använder 500 000 kärnor, 6 skåp och alla akademiker kan använda den.

04:44 EDT – Spinnaker använder 10nanojoule per spikanslutning. Människans hjärna är 10 femtojoule, BlueGene är cirka 1 Joule

04:45 EDT – Prof Furber utvecklade en Sudoku-lösare i 36400 neuroner, löser vilken sudoku som helst på 10 sekunder. Exempelprojekt

04:47 AM EDT – Tredje delen av Keynote, som handlar om cache- och minnesdesign för HPC för 2020-2030

04:50 AM EDT – Behöver tänka om minnet, massor av chiputrymme är dedikerat till minne

04:51 EDT – Det här föredraget är högt tempo med massor av bilddetaljer. Jag kan ta till en hel del bilder här

05:07 EDT – I grund och botten är Rowhammer ett problem. Hur man löser

05:29 EDT – Keynote är över, uppladdningen är 10KB/s så det är bara att vänta på att de sista bilderna ska laddas upp…

06:10 EDT – Uppladdat! Det är två dagars samtal att gå till för toppmötet. Du kan följa på #armsummit