[linux] Re: smartd offline uncorrectable sectors

Paul Slootman paul+nospam op wurtel.net
Wo Jan 11 14:46:23 CET 2006


On Wed 11 Jan 2006, Jelle Boomstra wrote:
> On Wednesday 11 January 2006 13:32, Paul Slootman wrote:
> > On Wed 11 Jan 2006, Jelle Boomstra wrote:
> > > On Wednesday 11 January 2006 13:00, Rob Sterenborg wrote:
> > > > Als het goed is wordt de data op de sectors die "problematisch" zijn
> > > > verplaatst naar andere sectors en worden de "oude" sectors gemarkeerd
> >
> > Dat kan dus niet zomaar, want dan raak je wellicht data kwijt zonder dat
> > dat bekend wordt. En dat kan erger zijn dan data gewoon kwijt raken...
> >
> > Als die sectors belangrijke gegevens bevatten, en die sectors onleesbaar
> > zijn ("uncorrectable read errors" duidt daar toch echt wel op)
> dit was de foutmelding: 
> smartd[2877]: Device: /dev/hda, 4 Offline uncorrectable sectors
> Hij komt elk uur in het log langs, smartd zal wel zo ingesteld staan om elk 
> uur een testje te doen. 

Nee, smartd zal ingesteld zijn om elk uur de SMART gegevens uit te lezen
(en afwijkende dingen te melden).  Als er niks verandert, dan blijven
die sectors in die status, en blijft die teller dus op 4 staan.


> > , dan kan 
> > de disk die sectors niet zomaar vervangen door reserve (spare) sectors,
> > de data zou dan "stilzwijgend" vervangen worden door random data...
> > Daarom zal een read actie een error geven, en een write actie gewoon
> > lukken (onderwater wordt dan dus een spare sector ingezet).
> 
> 
> Maar die errors zie ik niet. Het is een nieuwe installatie, dus de kans op 
> vers onstane fouten is klein tenzij de disk gewoon kapot is. Maar dan zou ik 
> veel meer foute sectoren verwachten, tenslotte is de disc al langer gebruikt. 

Heb je dan alles al gelezen? Elke sector van de disk?
En waarom zou je veel meer foute sectoren verwachten? De disk is al
langer gebruikt, dus je verwacht veel meer foute sectoren? Die conclusie volg
ik niet...

> > > > zodat ze niet meer worden gebruikt. Dat zullen de "offline" sectors
> > > > zijn verwacht ik.
> > >
> > > Dat lijkt mij ook. Maar praktisch gezien, moet ik mij er zorgen over
> > > maken, of alleen in de gaten houden dat die 4 sectors niet meer worden?
> >
> > Die "offline" unreadable sectors zijn ontdekt tijdens de SMART "offline"
> > selftest, dus niet tijdens accesses van de OS. Het is dus volledig
> > onbekend (met de gegeven informatie) of die sectors nou in gebruik zijn
> > of niet.
> 
> Huh? hij rapporteert ze elk uur, en doet een uitgebreidere test om 2 uur 
> 'snachts (als ik het goed begrepen heb tijdens de installatie).  En als de 
> smart interface van de schijf zegt dat ze offline zijn, dan heb ik geen reden 
> om daar aan te twijfelen. 

Ja, die 4 foute sectoren zijn dus geconstateerd tijdens zo'n
uitgebreidere test 's nachts (die dan toevallig een "offline" test
heet!) *DAAROM* heten die sectors "offline uncorrectable", die kunnen
dus niet tijdens de offline test gecorrigeerd worden.


> > Als de disk deel uitmaakt van een RAID-1 of -5 bijvoorbeeld, dan kan het
> > genoeg zijn om 'm uit de raid set te halen en weer toe te voegen; alle
> > data op de disk wordt dan overschreven, met als gevolg dat de kapotte
> > sectors vervangen worden. Als de disk "gewoon" ingezet is, dan wordt het
> > lastig...
> 
> Zoals ik daarnet al zei: het systeem is gisteren door mij geinstalleerd.

Ja, en? Dus is het RAID? of niet? ?????
Ook bij een nieuwe installatie kun je alle kanten op, hoor :-)


> > > Bij mijn weten kan het zeker voorkomen dat een schijf bij de productie al
> > > slechte sectors heeft en zorgt de schijf er zelf voor dat deze verwisseld
> > > worden met reserve sectors. Als het goed is gaat smartd mij emailen als
> > > het erg wordt (al weet ik niet hoe ik dat moet testen) en dat heb ik tot
> > > nu toe niet gezien.
> >
> > Het punt is dus dat die defecte sectors tijdens productie al
> > probleemloos vervangen kunnen worden; defecte sectors tijdens lees
> > acties of selftests kunnen dat niet.
> 
> Ja, maar wie zegt dat deze foute sectors die smart rapporteerd nieuw zijn? of 

Niemand. Ze zijn wel "nieuw" t.o.v. hoe de status was toen ie uit de
fabriek kwam.

> heb je liever dat de schijf zijn mond(=smart interface) dicht houd over 
> problemen die hij zelf kan oplossen? Dat lijkt mij onlogisch. 

Ik heb in mijn vorige mailtje vrij uitgebreid proberen uit te leggen
waarom dit niet zelf opgelost kan worden.  Doe eens een poging het te
begrijpen.  Leg anders uit hoe jij denkt dat de schijf dit zelf moet
oplossen, stap voor stap.


Paul Slootman



More information about the Linux mailing list