[linux] Re: Zoektoch naar oorzaak van hoge load

Hugo van der Kooij hvdkooij op vanderkooij.org
Di mei 30 22:28:02 CEST 2006


On Sat, 27 May 2006, Daniel C. von Asmuth wrote:

> Aldus schreef Hugo van der Kooij op Fri, May 26, 2006 at 10:33:19PM +0200:
> > On Fri, 26 May 2006, Casper Gielen wrote:
> >
> > > Op vrijdag 26 mei 2006 20:21, schreef Hugo van der Kooij:
> > > >
> > > > Ik heb een systeem met een load van rond de 2.0 of soms nog een stuk
> > > > hoger.
> > > >
> > > > Met top kan ik niets zien wat druk CPU eet of zo.
> > > >
> > > > Hoe kan ik zien welke processen bijdragen aan die load factor?
> > >
> > > Kijk eens (bv met vmstat) of er iets veel IO aan het doen is, dat wil de load
> > > nog wel opdrijven zonder dat je processor bezig is.
> >
> > # vmstat 5
> > procs -----------memory---------- ---swap-- -----io---- --system-- ----cpu----
> >  r  b   swpd   free   buff  cache   si   so    bi    bo   in    cs us sy id wa
> >  0  0   3752  13684  21376 652724    0    0    68    48   38    12 25  5 59 12
> >  0  0   3752  13444  21388 652920    0    0     1   403  406  1211  2  1 97  0
> >  2  0   3752  14936  21396 651456    0    0     0   306  398  1181  2  1 97  0
> >  0  0   3752  13696  21396 652760    0    0     0   289  398  1176  1  1 98  0
> >  0  0   3752  13760  21396 652684    0    0     0   440  442  1276  1  0 93  6
> >  0  0   3752  15376  21384 650972    0    0     0   310  404  1174  1  1 99  0
> >  0  0   3752  14152  21384 652272    0    0     0   287  390  1159  0  0 99  0
> >  0  0   3752  14488  21392 651928    0    0     0   306  404  1179  1  1 99  0
> >
> > Ehh. Ik heb wel een vermoeden dat het een taak is die I/O intensief is.
> > Mogelijk zelfs meer dan 1. Maar nu is het de kunst te vinden welke.
>
> Dit toont een CPU die bijna niets aan het doen is. Een beetje computer moet die
> 300 blocks/s I/O makkelijk aankunnen (ik neem aan dat je geen IDE gebruikt).
> 400 interrupts per seconde zegt dat je pinguïn het redelijk druk heeft, maar
> ook dat blijft binnen de perken. (kan wijzen op een systeem dat veel netwerk-
> verkeer heeft). 1200 context switches per seconde is heel hoog. (de laatste
> keer dat ik zoiets zag was de doos als een gek aan het swappen, maar dat is
> hier niet het geval).

Aannames hebben de neiging niet correct te zijn. Zo ook deze. Maar 3 mb/s
spuwen om een video device zoet te houden over het netwerk maakt hem niet
echt nerveus. Zorgvuldig dingen nalopen heeft wel wat issues gevonden die
van invloed zijn.

Zo is de MVP aansluiten op een hub beter als op een switch. Dit is een
bekend issue met de unit en heeft alles te maken met de maximum
performance van de netwerk chipset. (Die is bedroevend!)

Het verschil tussen wel of niet een stream afspelen via een NFS share:

 0  0   3736  69568  29252 554700    0    0     0    34  330   794  2  3 95  0
 0  0   3736  68784  29664 554700    0    0     3  1906  496   954  7  5 80  9
 0  0   3736  68784  29664 554700    0    0     0   166  389   754  1  1 98  0
 0  0   3736  68784  29664 554700    0    0     0     7  317   729  0  0 99  0
 0  0   3736  68908  29668 554700    0    0     0     6  323   783  1  1 98  0
 0  0   3736  69048  29672 554700    0    0     0   250  326   749  4  1 95  0
 0  0   3736  69048  29680 554700    0    0     0     7  322   719  0  0 99  0
 0  0   3736  69048  29724 554704    0    0     8    12  331   741  1  1 96  3
 0  0   3736  67992  29736 555940    0    0   248     6  681  1082  1  1 97  0
 0  0   3736  65472  29748 558492    0    0   510    10 1335  1483  0  2 98  0
 1  0   3736  63012  29764 560924    0    0   488    16 1323  1465  0  2 98  0
 0  0   3736  60460  29780 563484    0    0   513     8 1296  1444  1  2 97  0
 0  0   3736  57792  29788 566172    0    0   538    20 1398  1518  0  2 97  1
 0  0   3736  55752  29804 568220    0    0   410     8 1124  1366  0  2 98  0
 0  0   3736  53952  29816 570012    0    0   358     9  819  1085  1  1 98  0
 1  0   3736  52032  29836 571932    0    0   385     9 1053  1262  1  1 98  0

Maar zorgvuldig klok kijken als er een zichtbare invloed op de afspeel
kwaliteit deed me ook eens naar de crontab entries kijken. Het lijkt
namelijk op :05 :10 :35 en :40 op te treden. Maar op geen van de machines
staat een crontab job waar ik een match kan vinden. Althans ik verwacht
van een rijtje SNMPGET commando's elke 5 minuten naar deze machine een
ander patroon. (Namelijk elke 5 minuten.)

Later films kon ik zelfs zonder enige merkbare issues zien met deze load
nadat ik een test versie van de mvp firmware had vervangen voor een wat
stabielere versie.

Hugo.

-- 
	I hate duplicates. Just reply to the relevant mailinglist.
	hvdkooij op vanderkooij.org		http://hvdkooij.xs4all.nl/
		Don't meddle in the affairs of magicians,
		for they are subtle and quick to anger.




More information about the Linux mailing list