[linux] Re: ideetje: heeft iemand dit al een keer bedacht?

Cecil Westerhof cecilwesterhof op xs4all.nl
Wo Aug 8 19:04:29 CEST 2007


> Ik zit met het probleem dat ik een flink aantal bestanden (meer dan
> 200k) op
> orde moet brengen. En daar zitten waarschijnlijk flink wat dubbele in.
> En nu
> dacht ik dat het niet zo moeilijk zou moeten zijn, die te vinden door
> ze
> eerst op grootte te sorteren, dan een MD5 checksom o.i.d. over de
> bestanden
> van gelijke lengte, en dan de bestanden met gelijke checksum nog een
> keer
> vergelijken.
>
> Goed idee, niet? Zo goed eigenlijk dat ik me niet kan voorstellen dat
> iemand
> dat niet al eens geïmplementeerd heeft. Weet iemand een product? Het
> mag
> betaald zijn, als het maar betaalbaar is.

Lijkt me redelijk eenvoudig om hier een script voor te schrijven. Als
van het weekend nog niemand heeft gereageerd met een bestaand tooltje
of script wil ik er wel eens naar kijken.
Gekeken naar het aantal bestanden lijkt het me niet handig om
file-based te werken. Ik neem aan dat je daar MySQL hebt draaien? En
is Python geïnstalleerd? Daar zou ik dan het liefst mee werken.





More information about the Linux mailing list