[linux] Re: rsync backup

Paul Slootman paul+nospam op wurtel.net
Ma Feb 5 14:11:31 CET 2007


On Sun 04 Feb 2007, joop gerritse wrote:
> On Monday 29 January 2007 13:07, Paul Slootman wrote:
> > On Sun 28 Jan 2007, joop gerritse wrote:
> > > ik maak voor het werk dagelijks een backup van alle daarvoor in
> > > aanmerking komende bestanden met rsync. Dat gaat op het oog prima, maar
> > > ...
> >
> > Hoe precies?  rsync opties en evt. daemon config graag...
> 
> Opties zijn rltgoD En --stats natuurlijk.

Ik zou -a --no-p doen, dat vind ik makkelijker leesbaar als je per se
alles behalve de permissions wilt bewaren :)


> > Zijn de md5sums verschillend? 
> 
> Ja, die zijn verschillend. Het gekke is dat de bestandslengten wel gelijk 
> zijn. Maar de bestanden verschillen dus wel.

Een cmp -tussen de versies zou misschien ook wel leerzaam zijn, dan kun
je zien of veel bytes of juist maar een paar verschillen.

> Ze staan in die zin op dezelfde machine dat de ene als remote share gemount 
> is, en de andere op een USB schijf staat.  Je kunt je overigens afvragen of 
> rsync in een dergelijke situatie wel enig voordeel biedt t.o.v. gewoon cp ...

Niet, eigenlijk, omdat rsync geoptimaliseerd is om netwerk verkeer te
minimaliseren ten koste van disk IO. (Als je disk IO over het netwerk
gaat, dan heb je er dus niet veel aan.)  Alleen als er weinig verandert
kan het zin hebben, omdat cp niet kijkt naar de bestaande bestanden of
ze al OK zijn.

Let wel: rsync gebruikt per default meta-info om te bepalen of een
bestand anders is dan een andere; er wordt dus gekeken naar size,
owner/group, timestamp, permissions. Als die gelijk zijn, dan wordt de
file verder niet bekeken. Je kunt wel de --checksum optie gebruiken, dan
wordt ook een checksum berekend. Overigens wordt de checksum ook altijd
nog gedaan na het syncen van een file om te zien of de sync wel goed
gegaan is; dat een sync dus fout gaat is eigenlijk uitgesloten; als de
md5sum verschilt achteraf, dan is achteraf iets aan het een of het
andere bestand.

> > Laat van 2 bestanden die verschillen de md5sums zien, en ook de stat
> > output.
> 
> b068577bf9fd2d4f29423d94436619e1  file1
> b9e9c4f6bb5ede6e98c3d6baef23794a  file2
> 
> Ja, die zijn verschillend. Dat verbaast me ook niet echt.
> Ik geef ook de bijbehorende stats output:

Ik wilde idd. eigenlijk de "stat" output :)

> Number of files transferred: 0

> Ik zit net niet genoeg in rsync om hier  chocola van te maken.... ik krijg de 
> indruk, als ik naar de speedup kijk, dat rsync weinig reden zag om updates te 
> versuren. Dus zouden de md5sums toen toch gelijk geweest moeten zijn. Lijkt 
> me.

Nee, de meta-info was gelijk.
Alleen een windows systeem verzint het om een bestandsdatum gelijk te
houden terwijl er toch iets verandert :-(  Zo zal het openen van het
bestand in excel misschien een interne "laatst gelezen" veldje updaten
terwijl de datum van het bestand zelf ongewijzigd blijft... dat zou
simpel te checken moeten zijn voor iemand met een windows systeem met
excel er op.


Paul Slootman



More information about the Linux mailing list