[linux] Re: smartd offline uncorrectable sectors

Jelle Boomstra nllgg op nietsch.dds.nl
Wo Jan 11 13:50:31 CET 2006


On Wednesday 11 January 2006 13:32, Paul Slootman wrote:
> On Wed 11 Jan 2006, Jelle Boomstra wrote:
> > On Wednesday 11 January 2006 13:00, Rob Sterenborg wrote:
> > > Als het goed is wordt de data op de sectors die "problematisch" zijn
> > > verplaatst naar andere sectors en worden de "oude" sectors gemarkeerd
>
> Dat kan dus niet zomaar, want dan raak je wellicht data kwijt zonder dat
> dat bekend wordt. En dat kan erger zijn dan data gewoon kwijt raken...
>
> Als die sectors belangrijke gegevens bevatten, en die sectors onleesbaar
> zijn ("uncorrectable read errors" duidt daar toch echt wel op)
dit was de foutmelding: 
smartd[2877]: Device: /dev/hda, 4 Offline uncorrectable sectors
Hij komt elk uur in het log langs, smartd zal wel zo ingesteld staan om elk 
uur een testje te doen. 

> , dan kan 
> de disk die sectors niet zomaar vervangen door reserve (spare) sectors,
> de data zou dan "stilzwijgend" vervangen worden door random data...
> Daarom zal een read actie een error geven, en een write actie gewoon
> lukken (onderwater wordt dan dus een spare sector ingezet).


Maar die errors zie ik niet. Het is een nieuwe installatie, dus de kans op 
vers onstane fouten is klein tenzij de disk gewoon kapot is. Maar dan zou ik 
veel meer foute sectoren verwachten, tenslotte is de disc al langer gebruikt. 
>
> > > zodat ze niet meer worden gebruikt. Dat zullen de "offline" sectors
> > > zijn verwacht ik.
> >
> > Dat lijkt mij ook. Maar praktisch gezien, moet ik mij er zorgen over
> > maken, of alleen in de gaten houden dat die 4 sectors niet meer worden?
>
> Die "offline" unreadable sectors zijn ontdekt tijdens de SMART "offline"
> selftest, dus niet tijdens accesses van de OS. Het is dus volledig
> onbekend (met de gegeven informatie) of die sectors nou in gebruik zijn
> of niet.

Huh? hij rapporteert ze elk uur, en doet een uitgebreidere test om 2 uur 
'snachts (als ik het goed begrepen heb tijdens de installatie).  En als de 
smart interface van de schijf zegt dat ze offline zijn, dan heb ik geen reden 
om daar aan te twijfelen. 

> Als de disk deel uitmaakt van een RAID-1 of -5 bijvoorbeeld, dan kan het
> genoeg zijn om 'm uit de raid set te halen en weer toe te voegen; alle
> data op de disk wordt dan overschreven, met als gevolg dat de kapotte
> sectors vervangen worden. Als de disk "gewoon" ingezet is, dan wordt het
> lastig...

Zoals ik daarnet al zei: het systeem is gisteren door mij geinstalleerd.
>
> > Bij mijn weten kan het zeker voorkomen dat een schijf bij de productie al
> > slechte sectors heeft en zorgt de schijf er zelf voor dat deze verwisseld
> > worden met reserve sectors. Als het goed is gaat smartd mij emailen als
> > het erg wordt (al weet ik niet hoe ik dat moet testen) en dat heb ik tot
> > nu toe niet gezien.
>
> Het punt is dus dat die defecte sectors tijdens productie al
> probleemloos vervangen kunnen worden; defecte sectors tijdens lees
> acties of selftests kunnen dat niet.

Ja, maar wie zegt dat deze foute sectors die smart rapporteerd nieuw zijn? of 
heb je liever dat de schijf zijn mond(=smart interface) dicht houd over 
problemen die hij zelf kan oplossen? Dat lijkt mij onlogisch. 

-- 
met vriendelijke groeten,
Jelle Boomstra



More information about the Linux mailing list