[linux] Re: vreemd schijfgerelateerd probleem
Robert M. Stockmann
stock op stokkie.net
Wo Jun 18 22:35:56 CEST 2008
On Tue, 17 Jun 2008, Udo van den Heuvel wrote:
> Date: Tue, 17 Jun 2008 15:51:49 +0200
> From: Udo van den Heuvel <udovdh op xs4all.nl>
> Reply-To: linux op lists.nllgg.nl
> To: linux op lists.nllgg.nl
> Subject: [linux] vreemd schijfgerelateerd probleem
>
> Beste mensen,
>
> Sinds enige tijd (2.6.24.4 maar ook 2.6.25.6) heb ik last van het volgende:
>
> Om de zoveel tijd (20-30-40 minuten ofzo) zijn de disks erg druk en
> loopt de load binnen korte tijd op tot een veelvoud van het aantal CPU
> kernen.
> De %wa loopt op tot 70+%.
> Na een minuut of 1.5 zakt het e.e.a. weer naar normale waarden en is het
> systeem ook weer een stuk bruikbaarder.
> Er is als dit probleem zich voordoet niet zo snel 1 proces aan te wijzen
> als schuldige: zelfs als ik veel afsluit gebeurt het nog, ook na een
> verse boot.
> Er is geen proces met extreem hoge CPU belasting als het zich voordoet.
> Voorheen (weken terug) was het probleem er niet.
>
> De disks zijn 4 stuks SATA van 500G in RAID5(rest) en 1(/boot) met
> daarover dm-encryptie en LVM2. Hierop draait Fedora 9 x86_64.
> Er zijn geen errors te vinden qua disks in dmesg en messages.
>
> Ik gebruik beagle etc maar die zijn grotendeels bij, ingesteld op weinig
> tegelijk doen en komen niet op de voorgrond als het gebeurt.
>
> Hoe vis ik uit waardoor dit wederkerende fenomeen wordt veroorzaakt?
> En hoe zou ik het kunnen fixen?
Als je een paar rotte SATA disken hebt, dan moeten er constant
bijgehouden worden waar de rotte sectors zitten en waar ze er bij
komen. Dat schijnt een behoorlijke performance belasting te zijn. Check
met smartd of dat inderdaad zo is.
"Apr 14 18:13:06 jackson smartd[7115]: Device: /dev/sdb, SMART Prefailure
Attribute: 1 Raw_Read_Error_Rate changed from 74 to 76
Apr 14 18:13:06 jackson smartd[7115]: Device: /dev/sdb, SMART Usage
Attribute: 195 Hardware_ECC_Recovered changed from 74 to 76
=> Apr 14 18:13:06 jackson smartd[7115]: Device: /dev/sdd, 187 Currently
=> unreadable (pending) sectors
=> Apr 14 18:13:06 jackson smartd[7115]: Device: /dev/sdd, 187 Offline
=> uncorrectable sectors
Apr 14 18:43:06 jackson smartd[7115]: Device: /dev/sdb, SMART Prefailure
Attribute: 1 Raw_Read_Error_Rate changed from 76 to 75
Apr 14 18:43:06 jackson smartd[7115]: Device: /dev/sdb, SMART Usage
Attribute: 195 Hardware_ECC_Recovered changed from 76 to 75
=> Apr 14 18:43:06 jackson smartd[7115]: Device: /dev/sdd, 187 Currently
=> unreadable (pending) sectors
=> Apr 14 18:43:06 jackson smartd[7115]: Device: /dev/sdd, 187 Offline
=> uncorrectable sectors
Apr 14 18:43:06 jackson smartd[7115]: Device: /dev/sdb, SMART Prefailure
Attribute: 1 Raw_Read_Error_Rate changed from 76 to 75
Apr 14 18:43:06 jackson smartd[7115]: Device: /dev/sdb, SMART Usage
Attribute: 195 Hardware_ECC_Recovered changed from 76 to 75
=> Apr 14 18:43:06 jackson smartd[7115]: Device: /dev/sdd, 187 Currently
=> unreadable (pending) sectors
=> Apr 14 18:43:06 jackson smartd[7115]: Device: /dev/sdd, 187 Offline
=> uncorrectable sectors
Als je er binnen de garantie achterkomt, en je bovenstaande logging
aan je retailer laat zien, krijg je gewoon een nieuwe als
vervanging.
Vr.gr.
Robert
>
> Iemand?
>
> Groeten,
> Udo
>
>
> !DSPAM:4857c83213961662215162!
>
--
Robert M. Stockmann - RHCE
Network Engineer - UNIX/Linux Specialist
crashrecovery.org stock op stokkie.net
More information about the Linux
mailing list