Anslut till Senaste Tekniska Nyheter, Bloggar, Recensioner

Spänningslåsning: Undersöker AMDs senaste AM5 AGESA-uppdateringar på ASRocks X670E Taichi

Det är säkert att säga att de senaste veckorna har varit lite kaotiska för AMD och dess moderkortspartners. Tyvärr har det varit ännu mer kaotiskt för vissa användare med AMD:s Ryzen 7000X3D-processorer. Det har förekommit flera rapporter om Ryzen 7000-processorer som brinner upp i moderkort, och i vissa fall har de bränt ut själva chip-sockeln och tagit med sig moderkortet.

Under de senaste veckorna har vi täckt problemet när det har utvecklats, med AMD som släpper två officiella uttalanden och moderkortsleverantörer som kämpar för att säkerställa att deras användare har uppdaterat firmware i vad som känns som en snabb brandrea, ordlek väldigt mycket avsedd. Allt har inte gått enligt planerna, eftersom AMD har släppt två nya AGESA-firmwareuppdateringar genom sina moderkortspartners för att försöka lösa problemen inom en vecka.

Den första firmware-uppdateringen som gjordes tillgänglig för leverantörer, AGESA 1.0.0.6, åtgärdade rapporter om för höga SoC-spänningar. Denna AGESA-version satte begränsningar på plats för att begränsa den spänningen till 1,30 V, och distribuerades snabbt till alla AMDs partners. På senare tid har moderkortsleverantörer tryckt ut ännu nyare BIOS som inkluderar AMD:s AGESA 1.0.0.7 (BETA) uppdatering. Med ännu fler säkerhetsrelaterade ändringar gjorda under huven, är detta firmwareuppdateringen som AMD och deras moderkortspartners pressar konsumenterna att installera för att lindra problemen – och förhindra att nya uppstår.

I den här artikeln kommer vi att ta en titt på effekterna av alla tre uppsättningarna av firmware (AGESA 1.0.0.5c – 7) som körs på vårt ASRock X670E Taichi-moderkort. Målet är att avslöja vilka, om några, förändringar som finns i variabler med hjälp av AMD Ryzen 9 7950X3D, inklusive SoC-spänningar och ström som dras under intensiva minnesbaserade arbetsbelastningar.

Här är vår senaste täckning av Ryzen 7000X3D/7000 “utbrändhet”-problem, inklusive två uttalanden från AMD, ett officiellt svar från ASUS och MSI:

AMD Ryzen 7000 AGESA Firmware: Från 1.0.0.5c till 1.0.0.7 inom 32 dagar

Den första firmwareuppdateringen som gjordes tillgänglig för leverantörer, AGESA 1.0.0.6, tog upp rapporter om att SoC-spänningar var för höga, med nya begränsningar införda för att begränsa saker till 1,30 V. När det gäller kortet som vi har använt för att försöka och gräva djupare i problem, ASRock X670E Taichi, denna gjordes tillgänglig för allmänheten den 4/27/23 genom dess 1.21 firmware-uppdatering. Mer nyligen, den 5/4/23, gjorde ASRock sin senaste 1.24.AS02 firmware, som inkluderar AMD:s AGESA 1.0.0.7 (BETA) uppdatering.

AGESA 1.0.0.7 (BETA)-uppdateringen är den firmware som AMD har planerat att lansera senast för att lindra problemen med utbrändhet, inte bara för Ryzen 7000X3D-chips med 3D V-Cache, utan även för de bredare Ryzen 7000 och AM5 ekosystem. Mellan den inledande AGESA 1.0.0.5c-firmwaren som förde AMD:s Ryzen 7000X3D-stöd till AM5-moderkort, på bara 32 dagar, har AMD släppt totalt tre stora AGESA-versioner, som ASRock plikttroget har publicerat för X670E Taichi. Vi kommer att använda detta som vår baslinje för vår analys och titta på vad som händer.

Utöver detta planerar AMD också att släppa en ännu mer robust uppdaterad AGESA-firmware, vilket kan komma under de kommande veckorna. Benämnt internt som AGESA 1.0.0.9, vi kontaktade AMD för kommentarer om detta, men vår representant kunde inte kommentera “oannonserade eller endast interna mjukvarustackar.” Det bör också noteras att den nuvarande firmware i skrivande stund som är tillgänglig för användare är en BETA-version, vilket innebär att en nyare AGESA utan tvekan är på väg. Ändå är tidsskalan för releasen någons gissning för närvarande.

Så ser man på variationerna i AMD:s AGESA-uppdateringar under den senaste månaden, så har det inte funnits någon officiell indikation på förändringar utöver det absoluta minimum, åtminstone inte från ASRocks beskrivningar. Följande är vad ASRock säger om beskrivningarna av AGESA-uppdateringarna:

  • AGESA 1.0.0.5c: Initialt stöd för Ryzen 7000X3D-processorer med 3D V-Cache.
  • AGESA 1.0.0.6 (BETA): Förbättrad minneskompatibilitet, optimeringar för Ryzen 7000X3D, rekommenderad uppdatering för Ryzen 7000X3D-processorer.
  • AGESA 1.0.0.7 (BETA): Stöd för 48/24 GB DDR5-minnesmoduler.

Beskrivningen av förändringarna, åtminstone när det gäller att fastställa vad varje AGESA erbjuder, är på gränsen till ynklig. I ingen av beskrivningarna står det vilka ändringar AMD har gjort i varje AGESA-firmware för att lösa de aktuella problemen, vilket i ärlighetens namn är en ganska stor sak att utelämna. Det finns inga som helst indikationer på ASRocks X670E Taichi BIOS-sida om vad varje firmware ändras, och utan några offentliga anteckningar tillgängliga för användarna är det ett fall av “uppdatering till denna firmware, det rekommenderas.”

Så vad vet vi om förändringarna? Tja, vi vet att den kritiska förändringen från AGESA 1.0.0.5c till 0.6 och 0.7 versionerna är en låsning av SoC-spänningen till 1,30 V. Tidigare på ASRock X670E Taichi med 1.0.0.5c; vi kunde ställa in SoC-spänningen till 2,5 V, vilket nästan säkert skulle resultera i att våra X3D-chips stektes som ett ägg.


Bildkredit: Igor Wallossek, Igorslab.de

De andra ändringarna som kommer med AGESA 1.0.0.6, enligt Igor Wallosek, chefredaktör för Igorslab.de, AMD har också lagt till två nya PROCHOT-poster som pekar direkt på att bekämpa överhettning. PROCHOT betyder i huvudsak Processor Hot, och det är en kontrollerad mekanism som är utformad för att skydda processorn från överhettning. Det finns två implementeringar här. Den första är PROCHOT-kontrollmekanismen som är exakt vad det står på plåten. När CPU:n når ett definierat värde skickar komponenten en PROCHOT-styrsignal och CPU:n drar mindre ström för att försöka mildra temperaturer och minska risken för skador.

Den andra mekanismen är PROCHOT Deassertion Ramp Time, som dikterar hur länge en processor kan öka strömmen efter att den initiala PROCHOT-styrsignalen har avaktiverats. I huvudsak är PROCHOT Deassertion Ramp den tid det tar för processorn att komma tillbaka till normala parametrar, och olika variabler, inklusive kylning, aggressiviteten hos nämnda kylning och allmän värmeavledningskvalitet, kan diktera denna tid. Om processorn är otillräckligt kyld kan detta resultera i en längre ramptid för deassertion, medan mer aggressiva värmeavledningsmetoder teoretiskt sett bör möjliggöra en snabbare upprampningstid.

The Story So Far: Gamers Nexus Deep-Dive – The Ryzen 7000 CORE Fundamental Issues

Innan lanseringen av ny firmware undersökte Steve Burke, chefredaktören för Gamers Nexus, och hans team frågorna på djupet, inklusive att titta på den ursprungliga friterade hårdvaran från Speedrookie. Detta inkluderar en defekt och utbuktad Ryzen 7 7800X3D-processor och hans brända ASUS ROG STRIX X670E E Gaming-moderkort. Istället för att RMA’a hårdvaran nådde Steve Burke ut till användaren och erbjöd sig att köpa hårdvaran av honom, vilket minimerade RMA-ledtiden och gjorde det möjligt för Speedrookie att köpa ny hårdvara.

De 38:46 lång video är en mycket bra klocka, och vi rekommenderar verkligen att användare tittar på denna, särskilt för dem som är mer intresserade av de inre funktionerna (eller frågorna) hos Ryzen 7000X3D- och 7000-seriens processorer. För att sammanfatta Steves upptäckter tog vi bort följande punkter:

  • AMD Ryzen 7000X3D-processorer stängs av för sent för att mildra fysisk skada.
  • ASRock, GIGABYTE och MSI har en termisk utlösningspunkt på 116°C och ASUS har 106°C, men fungerade ibland inte som det var tänkt.
  • Den termiska gränsen för Ryzen 7000X3D är tänkt att vara 106°C och 116°C för Ryzen 7000.
  • AMD EXPO aktiverat på ASUS är 1,35V på SoC-spänning fram till BIOS 1202 (AGESA 1.0.0.6).
  • ASUS SoC Voltage-inställningar var/är för höga.
  • Utbyggnaden av AGESA firmware har varit inget annat än kaos vid det här laget.
  • AMD erbjuder RMA (betalar frakt åt båda hållen) på dödade processorer, även om EXPO har använts (åtminstone i USA)
  • Inget ord om om moderkortsleverantörer kommer att uppfylla garantin (i skrivande stund)

Medan Steve och hans team på Gamers Nexus har gått djupt in på att avslöja grundorsakerna till problemet, är en sak fortfarande helt klar: problemet är inte bara en som relaterar till SoC-spänning. Det har verkligen funnits en viss förvirring mellan AMD själva och dess moderkortspartners när det gäller att implementera lämplig felsäker för att förhindra att CPU (och moderkortssocket, för den delen) bränns i glömska.

Det andra problemet hänför sig till ASUS här, med en mer aggressiv implementering av sina SoC-spänningar, som Gamers Nexus bekräftade i sina tester som för höga. Innan AGESA-firmware-uppdateringen (1.0.0.6) genom BIOS-version 1202 översköt ASUS SoC-spänningen med 0,05 V över AMD:s nyligen införda SoC-spänningsgräns på 1,3 V.


Bildkredit: Gamers Nexus

Lödning av kablar och anslutning av moderkortet till en digital multimeter, en 1,35 V SoC-inställning inom ASUS firmware (och med EXPO aktiverad) resulterade i observerade 1,398 V från en SoC-pad. Detta var vanligtvis ännu högre när man undersökte vid choken, vid en iögonfallande 1,42 V. Detta utgör i grunden ett problem att ASUS firmware och själva SoC-skenorna inte lever bra ihop med varandra. Ytterligare 0,05 V ovanpå de rekommenderade 1,30 V är minst sagt mycket, men att lägga till ytterligare 0,05 V ovanpå det kan utan tvekan leda till dielektrisk försämring och möjligen leda till döda CPU:er och brända moderkortssocklar.

Genom att göra några preliminära tester av effekten av SoC-spänning på stabiliteten på den senaste AGESA 1.0.0.7 (BETA) firmware, skulle vårt G.Skill DDR5-6000 kit med DDR5-minne (2 x 16 GB) på ASRock X670E Taichi automatiskt förinställa 1.30 V på SoC när du använder EXPO-minnesprofilen. För att utveckla, försökte vi tyvärr 1,15 V, vilket var ett no-go, och även 1,20 V var ett no-go. Vi bestämde oss så småningom på 1,25 V på SoC för detta kit och vår Ryzen 9 7950X3D, och vi fann att stabiliteten i minnesintensiva riktmärken var stabil.

Kanske en av de största sakerna som kom utanför Gamers Nexus tester var att AMD nu erbjuder RMA-stöd för användare som har använt EXPO-minnesprofiler, något som normalt upphäver garantin på AMD:s processorer. Huruvida andra regioner har för avsikt att uppfylla dessa RMA-förfrågningar eller inte har inte bekräftats, men det är osannolikt att det blir ett problem.

Ändå är det en bra gest för användare med skadade processorer från ett problem som helt och hållet inte är deras fel. Moderkortsleverantörer, å andra sidan, arbetar inom sina policyer och parametrar, och det kan vara svårare att få en RMA på ett skadat moderkort helt enkelt för att AMD inte kontrollerar moderkortsleverantörernas RMA-policyer. Vi hoppas i god tro att moderkortsleverantörer kommer att uppfylla garantin i fall av dessa utbrändhetsproblem, men vi kan inte bekräfta om de kommer att göra det just nu.

Våra tester: metodik, testinställningar och hårdvara

För att sammanfatta anledningen till att testa AMD:s AGESA-firmware försöker vi inte replikera bränning av våra Ryzen 7000X3D-prover – tillräckligt många processorer har redan offrats för vetenskapen. För den delen såg eller luktade vi verkligen inte någon rök från vår ASRock X670E Taichi under testningen, så vi tar det som ett gott tecken.

Vårt syfte med testning är att belysa eventuella skillnader eller variationer i parametrar och effektrelaterade element som kommer från AMD:s senaste AGESA-paket. Detta inkluderar att titta på skenor som SoC-spänning och Package Power Tracking (PPT)-utgång från AM5 CPU-sockel. Eftersom AMD har angett vad användare och moderkortsleverantörer kan tillämpa när det gäller SoC-spänning till 1,30 V, är det värt att notera att all ASRocks firmware som vi har testat på X670E Taichi i detta stycke ställer automatiskt in SoC-spänningen till 1,30 V. Samtidigt som vi inte har de nödvändiga verktygen och utrustningen för att löda ledningar till moderkortet för att observera “fysiska” spänningar, vi förlitar oss på HWInfos rapporteringsförmåga, samt tittar på flera temperaturer.

Vi gjorde också några interna stabilitetstester mot de nya SoC-spänningsgränserna, och körde en ny serie tester på vår Ryzen 9 7950X3D ihopkopplad med ett G.Skill DDR5-6000 (2 x 16 GB) minneskit med dess AMD EXPO-minnesprofil aktiverad. Vi upptäckte att saker och ting inte var stabila förrän vi applicerade 1,25 V på SoC-spänningen i den fasta programvaran. Med upp till 1,25V på SoC var vårt kit stensäkert, även i minnesintensiva arbetsbelastningar och riktmärken.

Det har varit vårt fokus, att försöka pressa minnet så hårt vi kan för att säkerställa fullständig stabilitet. En hel del av fanfaren kring problemet, på det hela taget, har orättvist lagts på AMD:s EXPO-profiler som en av orsakerna; det är det inte. Vi vet att CPU-intensiva arbetsbelastningar kommer att generera mer värme, men det är inte vad vi har tittat på att undersöka. Vi letar efter variationer i ström och effekt mellan de olika firmware-versionerna för att se om AMD (och ASRock) har gjort optimeringar inom sitt ramverk för att minska dessa faktorer, med ström, eller mer specifikt överström och de integrerade felsäkerna som förbigås, vilket är en av de viktigaste problemen i utbrändhet.

Vår testbänk för vår AGESA (AM5) uppdateringstestning är som följer:

AMD Ryzen 7950X3D AGESA testplattform
CPU Ryzen 9 7950X3D (699 $)
16 kärnor, 32 trådar
120 W TDP
Moderkort ASRock X670E Taichi (BIOS 1.18, 1.21 & 1.24.AS02)
Minne G.Skill Trident Z5 Neo
2×16 GB
DDR5-5200 (JEDEC-standard)
DDR5-6000 CL34 (EXPO-profil)
Kyl EK-AIO Elite 360 ​​D-RGB 360 mm AIO
Lagring SK Hynix 2TB Platinum P41 PCIe 4.0 x4 NMve
Strömförsörjning Corsair HX1000
GPU:er AMD Radeon RX 6950 XT, drivrutin 31.0.12019
Operativsystem Windows 11 22H2

För vårt val av arbetsbelastningar förlitar vi oss på Memory Test Suite från Openbenchmarking.org via Phoronix för att implementera våra minnesintensiva arbetsbelastningar. Även om vissa av dessa arbetsbelastningar inte är optimerade och inte körs på Windows, använde vi CacheBench benchmark, som använder flera datatyper över läs, skriv, modifier och läs/skriv/modifiera kombinerat. Som en del av LLCbench riktmärkesvit för arkitektonisk karakterisering på låg nivåCacheBench är designad för att testa minnes- och cachebandbreddsprestanda och förlitar sig på en kompilering av C++-verktygskedjor och kompilatorer.

Läs vidare för mer analys.