Jag pratade precis med Intels Steve Smith (VP och direktör för Intel Client PC Operations and Enabling) och fick lite mer detaljer om morgonens 6-serie chipset/SATA bugg.
Problemet
Cougar Point (Intels 6-serie-chipset: H67/P67) har två uppsättningar SATA-portar: fyra som stöder 3Gbps-drift och två som stöder 6Gbps-drift. Varje uppsättning portar kräver sin egen PLL-källa.
Problemet i styrkretsen spårades tillbaka till en transistor i 3Gbps PLL-klockningsträdet. Den tidigare nämnda transistorn har en mycket tunn gate-oxid, vilket gör att du kan slå på den med mycket låg spänning. Tyvärr förspände Intel i detta fall transistorn med för hög spänning, vilket resulterade i högre läckström än förväntat. Beroende på transistorns fysiska egenskaper kan läckströmmen här öka med tiden, vilket i slutändan kan resultera i detta fel på 3Gbps-portarna. Det faktum att 3Gbps- och 6Gbps-kretsarna har sina egna oberoende klockningsträd är det som säkerställer att detta problem är begränsat till endast portarna 2 – 5 utanför styrenheten.
Du kan lösa problemet tidigare genom att testa PCH vid ökade spännings- och temperaturnivåer. Genom att öka ett eller båda av dessa värden kan du simulera belastning över tid och det var så problemet först upptäcktes. Intel tror att eventuella problem som användare har med SATA-prestanda/kompatibilitet/tillförlitlighet sannolikt inte är relaterade till hårdvarufelet.
En lösning för denna typ av problem skulle vara att skala ner spänningen som appliceras över den problematiska transistorn. I det här fallet finns det ett mycket enklare alternativ. Källan till problemet är faktiskt inte ens en viktig del av 6-seriens chipsetdesign, det är en rest av en tidigare design som inte längre behövs. I vår recension av Sandy Bridge påpekade jag hur mycket designåteranvändning som gjordes för att skapa 6-seriens chipset. Lösningen Intel har tänkt ut är att helt enkelt ta bort spänningen till transistorn. Chipet är funktionellt inte annorlunda, men genom att permanent inaktivera transistorn kommer problemet aldrig att uppstå.
För att göra saken värre infördes problemet vid B-steppingen av 6-seriens chipset. Tidigare steg (som det vi förhandsvisade förra sommaren) hade inte problemet. Tyvärr för Intel levererade endast B-stepping chipsets till kunder. Eftersom fixen innebär att spänningen till en transistor bryts kommer den att fixas med ett nytt spinn av metall och du får en ny tillhörande stegning (förmodligen C-stepping?).
Även om Steve inte ville gå in mer i detalj nämnde han hela tiden att denna bugg var fullständigt ett förbiseende. Det låter för mig som att en ingenjör gjorde något utan att tänka och det här blev resultatet. Det här skiljer sig lite från min första syn på problemet. Intel karakteriserade ursprungligen problemet som rent statistiskt, men källan låter mycket mer som ett designproblem snarare än helt slumpmässigt.
Det är Notta Recall
Intel har skickat runt 8 miljoner 6-serier chipset sedan lanseringen på CES. Man åtog sig också att avsätta 700 miljoner dollar för att reparera och byta ut alla berörda chipset. Det blir $87,50 per chipset om det finns 8 miljoner påverkade chipset på marknaden, nästan kostnaden för ett helt moderkort. Nu måste medlen täcka leverans av den nya styrkretsen, ta in det drabbade moderkortet och reparera det eller skicka ut ett nytt. Intel kan äta upp kostnaderna för chipsetet, och lämna 87,50 $ för frakt, arbete och tid, såväl som alla andra överväganden som Intel tillhandahåller OEM (här är 5 $, hata oss inte för mycket). I slutet av dagen verkar det som tillräckligt med pengar för att hantera problemet. Men Intel var mycket noga med att påpeka att detta inte är ett fullständigt återkallande. Varför är enkelt.
Om du har ett stationärt system med sex SATA-portar som drivs av P67/H67-chipset, finns det en chans (minst 5%) att under normal användning kommer några av 3Gbps-portarna att sluta fungera under loppet av 3 år. Ju längre du använder portarna, desto högre blir den procentandelen. Om du hamnar i den här kategorin är chansen stor att din moderkortstillverkare kommer att sätta upp något slags utbyte där du får ett fast kort. Moderkortstillverkaren kunde helt enkelt avlöda din 6-serie chipset och ersätta den med en nyare stepping om den ville vara sparsam.
Om du har ett bärbar datorsystem med bara två SATA-portar är scenariot dock lite mindre tydligt. Bärbara datorer har inte massor av lagringsutrymmen och därför använder de inte alltid alla portar som en chipset erbjuder. Om en notebook-design bara använder portarna 0 & 1 utanför chipsetet (de opåverkade portarna), skulle slutanvändaren aldrig stöta på ett problem och den bärbara datorn kanske inte ens återkallas. Faktum är att om det finns notebook-designer i pipelinen som bara använder port 0 och 1 kanske de inte försenas av dagens tillkännagivande. Detta är den enda källan till hopp om du letar efter ett opåverkat releaseschema för din SNB-dator med dubbla kärnor.
Slutord
Intel hävdar att Sandy Bridge-processorer inte påverkas, och nuvarande användare är mycket osannolikt att stöta på problemet även under tung belastning. Hittills har Intel bara kunnat dokumentera problemet efter att ha kört utökade tester vid höga temperaturer (i en termisk kammare) och spänningar. Min rekommendation är att försöka använda endast portarna 0 & 1 (6Gbps-portarna) på ditt moderkort i 6-serien tills du får en ersättning på plats.
OEM-tillverkare och moderkortstillverkare kommer att prata med Intel under nästa vecka för att ta reda på nästa steg. Intel planerar att leverera fast kisel till sina partners i slutet av februari, men det kommer fortfarande att ta tid för moderkortstillverkarna att förvandla dessa chips till produkter. Jag skulle inte förvänta mig ersättare förrän tidigast i mars.
Jag hävdar att den bästa gesten av välvilja från Intels sida skulle vara att göra det möjligt för moderkortstillverkare att ersätta P67/H67-moderkort med Z68-kort för de användare som vill ha dem.
