[linux] Grep krijgt geen grip op binaire bestanden

Daniel C. von Asmuth asmuth op bakunin.xs4all.nl
Vr Jun 19 12:57:04 CEST 2020


Aldus schreef Jan Paul Smit op Fri, Jun 19, 2020 at 10:32:21AM +0200:
> Beste Linux-mensen,
> 
> In een vorige mail schreef Daniel von Asmuth:
> 
>      https://wiki.debian.org/FullT <https://wiki.debian.org/FullTextSearch>
> > >         https://www.linuxlinks.com/de
> <https://www.linuxlinks.com/desktopsearchengines/>
> > >         https://dtsearch.com/   (geen gratis software)
> > >
> > > https://www.linuxuprising.com/
> <https://www.linuxuprising.com/2019/05/drill-new-desktop-file-search-utility.html>
> > >         https://linuxhint.com/best-se
> 
> Ik heb de suggesties bekeken, maar dit is nog te moeilijk voor mij en ik
> heb op dit moment niet de tijd om me er heel erg in te verdiepen.

Het probleem is ook iets ingewikkelder dan het op het eerste gezicht lijkt. 
Zoals gezegd gaat grep dit niet zo maar kunnen oplossen. 

> Bovendien gaat het mij eigenlijk heel eenvoudig om zo nu en dan mijn –
> voornamelijk Word 97 – documenten in mijn map Documenten op een bepaald
> woord te doorzoeken, als ik er niet uit kom met zoeken op een woord(deel)
> in de bestandsnaam.

Word 97 documenten kunt u in platte tekst omzetten met catdoc en recentere
word documenten met docx2txt. Daarna kunt u er met grep in zoeken. We weten
niet wat voor bestandsformaten u nog meer heeft. 

Eigenlijk zou Pandoc het ook moeten kunnen, maar dat is een vrij complex
programma. 

> In mijn onschuld dacht ik dat het om een eenvoudig stukje code zou gaan,
> maar uit jullie reacties begrijp ik dat het ingewikkelder ligt.
> 
> Ook de suggestie van Daniel von Asmuth
> 
> “Probeer eens:
>         grep -r -i -H -s fiets /home/jan-paul/Documenten”
> 
> heb ik uitgeprobeerd, maar werkte bij mij niet.
> 
> Ik gebruik de code ‘ | cut -d: -f1’ om een overschot aan tekst in rtf-,
> txt- en html-bestanden kwijt te raken, maar wel het pad te behouden.
> 
> zgrep heb ik ook uitgeprobeerd in plaats van grep; geen resultaat.
> 
> Toch is het merkwaardige dat grep sommige Word-documenten met een een
> bepaald zoekwoord wel op de lijst zet en andere Word-documenten met
> hetzelfde zoekwoord niet.

U zou natuurlijk kunnen proberen om die documenten met 'od' te dumpen om
een idee te krijgen waarom grep het wel of niet vindt. 

> Ik heb van alles uitgeprobeerd:

Met vriendelijke groet,



Daniel von Asmuth 
-- 
	
		How long it takes to reach your goal
		depends less on your speed than on your direction.


Meer informatie over de Linux maillijst