[linux] Re: vreemd schijfgerelateerd probleem

Robert M. Stockmann stock op stokkie.net
Wo Jun 18 22:35:56 CEST 2008


On Tue, 17 Jun 2008, Udo van den Heuvel wrote:

> Date: Tue, 17 Jun 2008 15:51:49 +0200
> From: Udo van den Heuvel <udovdh op xs4all.nl>
> Reply-To: linux op lists.nllgg.nl
> To: linux op lists.nllgg.nl
> Subject: [linux] vreemd schijfgerelateerd probleem
> 
> Beste mensen,
> 
> Sinds enige tijd (2.6.24.4 maar ook 2.6.25.6) heb ik last van het volgende:
> 
> Om de zoveel tijd (20-30-40 minuten ofzo) zijn de disks erg druk en
> loopt de load binnen korte tijd op tot een veelvoud van het aantal CPU
> kernen.
> De %wa loopt op tot 70+%.
> Na een minuut of 1.5 zakt het e.e.a. weer naar normale waarden en is het
> systeem ook weer een stuk bruikbaarder.
> Er is als dit probleem zich voordoet niet zo snel 1 proces aan te wijzen
> als schuldige: zelfs als ik veel afsluit gebeurt het nog, ook na een
> verse boot.
> Er is geen proces met extreem hoge CPU belasting als het zich voordoet.
> Voorheen (weken terug) was het probleem er niet.
> 
> De disks zijn 4 stuks SATA van 500G in RAID5(rest) en 1(/boot) met
> daarover dm-encryptie en LVM2. Hierop draait Fedora 9 x86_64.
> Er zijn geen errors te vinden qua disks in dmesg en messages.
> 
> Ik gebruik beagle etc maar die zijn grotendeels bij, ingesteld op weinig
>  tegelijk doen en komen niet op de voorgrond als het gebeurt.
> 
> Hoe vis ik uit waardoor dit wederkerende fenomeen wordt veroorzaakt?
> En hoe zou ik het kunnen fixen?

Als je een paar rotte SATA disken hebt, dan moeten er constant 
bijgehouden worden waar de rotte sectors zitten en waar ze er bij 
komen. Dat schijnt een behoorlijke performance belasting te zijn. Check 
met smartd of dat inderdaad zo is.

  "Apr 14 18:13:06 jackson smartd[7115]: Device: /dev/sdb, SMART Prefailure
   Attribute: 1 Raw_Read_Error_Rate changed from 74 to 76
   Apr 14 18:13:06 jackson smartd[7115]: Device: /dev/sdb, SMART Usage
   Attribute: 195 Hardware_ECC_Recovered changed from 74 to 76
=> Apr 14 18:13:06 jackson smartd[7115]: Device: /dev/sdd, 187 Currently
=> unreadable (pending) sectors
=> Apr 14 18:13:06 jackson smartd[7115]: Device: /dev/sdd, 187 Offline
=> uncorrectable sectors
   Apr 14 18:43:06 jackson smartd[7115]: Device: /dev/sdb, SMART Prefailure
   Attribute: 1 Raw_Read_Error_Rate changed from 76 to 75
   Apr 14 18:43:06 jackson smartd[7115]: Device: /dev/sdb, SMART Usage
   Attribute: 195 Hardware_ECC_Recovered changed from 76 to 75
=> Apr 14 18:43:06 jackson smartd[7115]: Device: /dev/sdd, 187 Currently
=> unreadable (pending) sectors
=> Apr 14 18:43:06 jackson smartd[7115]: Device: /dev/sdd, 187 Offline
=> uncorrectable sectors
   Apr 14 18:43:06 jackson smartd[7115]: Device: /dev/sdb, SMART Prefailure
   Attribute: 1 Raw_Read_Error_Rate changed from 76 to 75
   Apr 14 18:43:06 jackson smartd[7115]: Device: /dev/sdb, SMART Usage
   Attribute: 195 Hardware_ECC_Recovered changed from 76 to 75
=> Apr 14 18:43:06 jackson smartd[7115]: Device: /dev/sdd, 187 Currently
=> unreadable (pending) sectors
=> Apr 14 18:43:06 jackson smartd[7115]: Device: /dev/sdd, 187 Offline
=> uncorrectable sectors

Als je er binnen de garantie achterkomt, en je bovenstaande logging
aan je retailer laat zien, krijg je gewoon een nieuwe als
vervanging.

Vr.gr.

Robert

> 
> Iemand?
> 
> Groeten,
> Udo
> 
> 
> !DSPAM:4857c83213961662215162!
> 

-- 
Robert M. Stockmann - RHCE
Network Engineer - UNIX/Linux Specialist
crashrecovery.org  stock op stokkie.net




More information about the Linux mailing list