Anslut till Senaste Tekniska Nyheter, Bloggar, Recensioner

Intel upptäcker en bugg i 6-seriens chipset: vår analys


Uppdatering: Vi har mer information om källan till felet.

I vår recension av Sandy Bridge påpekade jag att Intel tyvärr var väldigt konservativa på ett område av plattformen: dess styrkrets. Även om 6-seriens chipset äntligen förde infödd 6 Gbps SATA till Intel-plattformar, lyckades den inte åtgärda problem med 23,976 fps videouppspelning. Intel lyckades inte heller leverera en styrkrets som kan stödja SNB:s processorgrafik såväl som överklockning. Idag blev det bara ännu mer nedslående.

Intel bara meddelade att den har identifierat en bugg i 6-seriens chipset, speciellt i sin SATA-kontroller. Intel uppger att “I vissa fall kan Serial-ATA (SATA)-portarna i chipseten försämras med tiden, vilket potentiellt påverkar prestandan eller funktionaliteten hos SATA-länkade enheter som hårddiskar och DVD-enheter.”

Fixeringen kräver ny hårdvara, vilket innebär att du måste byta ut ditt moderkort mot ett nytt. Intel har inte lagt ut några instruktioner om hur återkallelsen kommer att hanteras förutom att kontakta Intel via sin supportsida eller kontakta tillverkaren av din hårdvara direkt. När vi pratar med moderkortstillverkare verkar det som om de är lika förvånade över detta som jag.

Intel kommer att börja leverera den fasta versionen av styrkretsen i slutet av februari. Återkallelsen kommer att minska Intels intäkter med cirka 300 miljoner dollar och kosta cirka 700 miljoner dollar för att helt reparera och ersätta berörda system.

Allt var bra för bara en vecka sedan

Här är tidslinjen.

Intel har testat sin 6-serie chipset i flera månader nu. Chipsetet klarade alla sina interna kvalifikationstester såväl som alla OEM-kvalificeringstester. Detta är samma tester som alla Intel-kretsuppsättningar måste gå igenom, testar saker som funktionalitet, tillförlitlighet och beteende vid olika förhållanden (höga temp, belastningstemp, högspänning, lågspänning, etc…). Chipsetet klarade sig bra genom alla dessa tester.

Det finns två generella typer av problem du stöter på vid chiptillverkning. Den första är en teknisk tillsyn: funktionella problem som kommer att orsaka fel under dina valideringstest. Du får dessa genom att inte ge dina ingenjörer tillräckligt med sömn och de designar en krets som logiskt eller funktionellt har ett problem i sig. Det var den typen av fel som till exempel resulterade i NVIDIAs Fermi-fördröjning.

Den andra typen av problem är mer irriterande, det är en bugg av statistisk karaktär. I dessa situationer dyker problemet inte upp på varje chip i alla situationer, utan på vart n:e chip av varje nx något stort antal marker. När en bugg inte visar sig i små mängder är det mycket svårt att spåra. Detta är karaktären hos 6-seriens chipset-bug och det är också anledningen till att problemet inte dök upp tidigare.

Intel nämnde att efter att de hade byggt över 100 000 chipset började det få några klagomål från sina kunder om fel. I början av förra veckan duplicerade Intel och bekräftade felet i huset.

Intel satte ihop ett team av ingenjörer för att upptäcka källan till problemet. Baserat på tidslinjen ser det ut som att det tog dem ett par dagar att ta reda på det. Intel tillbringade sedan några dagar till med att försöka förstå konsekvenserna av problemet. Slutligen, sent i går kväll, beslutade Intel att det enda tillvägagångssättet skulle vara ett återkallande och det stoppade produktionen av sina 6-serier chipset.

Återkallelser är aldrig kul att göra. Om du inte har en ersättningsprodukt på marknaden innebär det att din försäljning stannar. Du måste också ta itu med att faktiskt återkalla all defekt hårdvara, vilket kostar mycket pengar. Intel förväntar sig att det kommer att kosta $700 miljoner att faktiskt återkalla och fixa hårdvara på marknaden idag och ytterligare $300 miljoner förlorade intäkter för chipsetverksamheten medan allt detta händer. Sammantaget talar vi om en straffavgift på en miljard dollar. Det är som Intels version av RRoD [Ed: Microsoft’s Xbox 360 Red Ring of Death]men utan år av förnekelse.

Misslyckandet manifesterade

Jag frågade Intel hur vi skulle veta om vi hade ett fel på våra händer. Symtomen är ganska enkla att kontrollera. Intel säger att du skulle se en ökning av bitfelfrekvensen på en SATA-länk över tiden. Överföringar kommer att göra ett nytt försök om det finns ett fel, men så småningom, om felfrekvensen är tillräckligt hög, kommer du att se minskad prestanda eftersom styrenheten spenderar mer tid på att försöka igen än att skicka faktiska data.

I slutändan kunde du se en fullständig frånkoppling – dina SATA-enheter skulle inte längre vara synliga vid POST eller så skulle du se en enhetsbeteckning försvinna i Windows.

Den är begränsad till endast 3Gbps-portar

Intressant nog påverkar problemet inte portarna 0 och 1 på 6-seriens chipset. Kom ihåg att Intel har två 6Gbps-portar och fyra 3Gbps-portar på P67/H67, endast de fyra sistnämnda påverkas av detta problem.



Intels DP67BG—De blå SATA-portarna till höger är 6 Gbps, de svarta är 3 Gbps. De blå portarna påverkas inte av buggen.

Om du är en aktuell Sandy Bridge-användare och vill vara säker på att du inte har några problem förrän du kan få ersättningshårdvara, håll dig till att använda 6Gbps-portarna på ditt kort (som borde vara de två första portarna).

Fixen

SATA-felet finns i hårdvaran och det finns inget sätt att tillhandahålla en drivrutins- eller firmwareuppdatering som kan fixa det. Fixeringen kräver ett metallskiktbyte, vilket kommer att resultera i en ny hårdvarustegring (vilket resulterar i ~3 veckors fördröjning innan ersättningshårdvaran är klar).

Hur är det med nuvarande Sandy Bridge-ägare?

På sitt konferenssamtal för att diskutera frågan sa Intel till mig att de inte har blivit medvetna om ett enda fel som slutanvändare har sett. Intel förväntar sig att över 3 års användning skulle den få en felfrekvens på cirka 5 – 15 % beroende på användningsmodell. Kom ihåg att det här problemet inte är ett funktionellt problem utan snarare ett av de där otäcka statistiska problemen, så av naturen borde det ta tid att dyka upp i stort antal (samtidigt bör det fortfarande finnas några mycket isolerade fall av fel tidigt).

Intel har redan stoppat produktionen av sina 6-serier chipset och kommer att börja leverera fasta versioner av chipset i slutet av februari. Du kan förvänta dig moderkortsbrist till och med mars åtminstone. Intel hoppas kunna möta efterfrågan i april.

För närvarande säger Intel att det bästa tillvägagångssättet är att kontakta sitt supportteam för information om utbyte, även om jag gissar att när de fasta styrkretsen är tillgängliga kommer vi att ha ersättningsplaner från alla moderkortstillverkare.

Ingen är glad över detta

Med tanke på tidslinjen för upptäckten dröjde inte Intel med att komma runt för att faktiskt låta sina partners veta om problemet. På den ljusa sidan betyder det att Intel och dess partners inte planerade mot sina slutanvändare för att sopa detta under mattan. På minussidan kan inte OEM-tillverkare och moderkortstillverkare vara glada över detta – de vaknade till nyheten om återkallelsen samtidigt som du och jag gjorde det.

Intel börjar föra diskussioner med OEM-tillverkare idag (japp, du läste rätt) om hur man ska hantera återkallelsen och när fast hårdvara kommer att finnas tillgänglig. Detta är anledningen till att det för närvarande inte finns någon officiell, offentlig återkallelseplan på plats. Under de kommande veckorna förväntar jag mig att detta kommer att lösas, men för närvarande är det bästa rådet jag kan ge befintliga SNB-ägare att använda sina 6Gbps-portar och vänta.


Uppdatering: Intel informerar mig om att det var juridiskt skyldigt att offentliggöra återkallelsen innan de informerade sina OEM-kunder i detta fall. Detta är tydligen ett lagkrav.

Z68 Schema opåverkat

Jag frågade Intel om 6-seriens derivata styrkretsar påverkades av problemet, särskilt Z68-chipset. Medan alla chipset i 6-serien är utsatta för problemet, förblir lanseringsschemat för alla framtida derivat opåverkat. Z68 kommer att fortsätta att lanseras någonstans under andra kvartalet 2011. Jag förväntar mig att se moderkort runt april.

På CES pratade jag länge med Intel om den frustrerande karaktären hos P67/H67-funktionssegmenteringen. Det faktum att det inte finns någon styrkrets som låter dig använda Intels processorgrafik och överklocka din CPU är ett stort misstag. Intels Z68-chipset kommer att åtgärda denna brist, samt lägga till ytterligare funktioner (t.ex. SSD-cache) som är exklusiva för Z68. Jag är besviken över att Intel inte var bättre förberedd på chipsetsidan vid SNB-lanseringen och dagens tillkännagivande är grädde på moset. Om du ändå ska behöva vänta med att köpa skulle jag rekommendera att vänta tills Z68-moderkort kommer ut på marknaden.

För befintliga ägare skulle jag hoppas att Intel och moderkortstillverkarna kan erbjuda något slags bytes- eller inbytesprogram för att flytta till Z68 eftersom du ändå måste byta ut ditt moderkort.

Vänta längre på de där MacBook-proffsen

Har du märkt en brist på Sandy Bridge-baserade bärbara datorer med dubbla kärnor på marknaden? Intel ville men kunde inte lansera varenda SNB-SKU samtidigt, så de tvåkärniga bärbara datorerna drevs ut till mitten till slutet av februari. Tyvärr var det pre-bugg. Med denna senaste fördröjning bör du inte förvänta dig SNB-datorer med dubbla kärnor förrän tidigast några veckor efter deras ursprungliga lanseringsdatum.

Om vi ​​antar att fasta chipset är tillgängliga sista veckan i februari, kan de sättas in i system första veckan i mars. Räkna sedan med minst en veckas testning och validering om inte mer. Lägg till ytterligare en vecka för att öka produktionen och vi tittar på slutet av mars eller början av april för SNB-datorer med dubbla kärnor. De av er som väntar på Apples uppdaterade MacBook Pros faller i denna kategori. Jag skulle säga att april är ett säkert kort om du väntar på en uppgradering.