<div dir="ltr">


        
        <span></span>
        
        


<p class="gmail-western" style="margin-bottom:0cm;font-family:"Times New Roman",serif;font-size:12pt;direction:ltr;color:rgb(0,0,0)">Beste Geert, Daniel,
Gijs en anderen,</p>
<p class="gmail-western" style="margin-bottom:0cm;font-family:"Times New Roman",serif;font-size:12pt;direction:ltr;color:rgb(0,0,0)">

</p>
<p class="gmail-western" style="margin-bottom:0cm;font-family:"Times New Roman",serif;font-size:12pt;direction:ltr;color:rgb(0,0,0)">Opnieuw bedankt voor
jullie commentaar en suggesties! Het wordt me langzaam maar zeker
duidelijk waar de schoen wringt.</p>
<p class="gmail-western" style="margin-bottom:0cm;font-family:"Times New Roman",serif;font-size:12pt;direction:ltr;color:rgb(0,0,0)">

</p>
<p class="gmail-western" style="margin-bottom:0cm;font-family:"Times New Roman",serif;font-size:12pt;direction:ltr;color:rgb(0,0,0)">Ik heb inderdaad Ubuntu
en ik kan alle Word-97 documenten probleemloos openen in LibreOffice</p>
<p class="gmail-western" style="margin-bottom:0cm;font-family:"Times New Roman",serif;font-size:12pt;direction:ltr;color:rgb(0,0,0)">

</p>
<p class="gmail-western" style="margin-bottom:0cm;font-family:"Times New Roman",serif;font-size:12pt;direction:ltr;color:rgb(0,0,0)">Ik ga kijken of ik
mijn Word-97 documenten om kan zetten in txt-bestanden via pandoc. In
principe zou dat een goede oplossing zijn, want txt-bestanden kan ik
prima doorzoeken met grep.</p>
<p class="gmail-western" style="margin-bottom:0cm;font-family:"Times New Roman",serif;font-size:12pt;direction:ltr;color:rgb(0,0,0)">

</p>
<p class="gmail-western" style="margin-bottom:0cm;font-family:"Times New Roman",serif;font-size:12pt;direction:ltr;color:rgb(0,0,0)">Groeten,  Jan Paul</p><p class="gmail-western" style="margin-bottom:0cm;font-family:"Times New Roman",serif;font-size:12pt;direction:ltr;color:rgb(0,0,0)">

</p>

===</div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">Op vr 19 jun. 2020 om 12:21 schreef Gijs Hillenius <<a href="mailto:gijs@hillenius.net">gijs@hillenius.net</a>>:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">On 19 June 2020 10:32 Jan Paul Smit, wrote:<br>
<br>
<br>
[...]<br>
<br>
<br>
> Bovendien gaat het mij eigenlijk heel eenvoudig om zo nu en dan mijn –<br>
> voornamelijk Word 97 – documenten in mijn map Documenten op een bepaald<br>
> woord te doorzoeken, als ik er niet uit kom met zoeken op een woord(deel)<br>
> in de bestandsnaam.<br>
<br>
Jan Paul,<br>
<br>
Je gebruikt Ubuntu, toch? Werkt dit?<br>
<br>
<a href="https://help.ubuntu.com/stable/ubuntu-help/files-search.html.en" rel="noreferrer" target="_blank">https://help.ubuntu.com/stable/ubuntu-help/files-search.html.en</a><br>
<br>
<br>
Het is me uit de eerder posts hier niet 1 2 3 duidelijk of je deze<br>
documenten wel of niet kan openen met bijvoorbeeld LibreOffice? Da's<br>
helemaal niet hetzelfde als zoeken in alle documenten. Maar het is toch<br>
handig om te weten.<br>
<br>
Als grep en strings je nu niet helpen, overweeg dan om die documenten te<br>
exporteren naar text. Dat kan op vele manieren.<br>
<br>
Ik raad je pandoc aan. Dat moet je misschien nog even installeren, maar<br>
daar krijg je geen spijt van.<br>
<br>
Wat ik hieronder doe heb ik op een zootje bestanden getest, en het werkt<br>
hier. Maar toch - doe onderstaand *niet* in "echte" folder, maar maak<br>
een tijdelijke kopie in bijvoorbeeld /tmp/hutsefluts en zet daar alle<br>
documenten die je wilt converteren.<br>
<br>
open een shell<br>
ga naar die folder - in mijn geval is dat dan:<br>
<br>
cd /tmp/hutsefluts<br>
<br>
en tiep dan<br>
<br>
find . -name \*.docx -type f -exec pandoc -o {}.txt {} \;<br>
<br>
Dit betekent: vind alle files (geen directories) die .docx als<br>
achtervoegsel hebben, geef ze een voor een aan pandoc, en pandoc,<br>
converteer ze naar txt.<br>
<br>
Als je nog oudere documenten hebt in doc, dan brandt Pandoc zich daar<br>
niet aan. Dan moet het via LibreOffice, bijvoorbeeld<br>
<br>
find . \( -name \*.doc -o -name \*.docx \) -type f -exec soffice --headless --convert-to txt:Text  {} \;<br>
<br>
Dit betekent: vind alle files doc en of docx en voer ze aan libreoffice<br>
(synonyiem in de commandline soffice) om er text van te maken.<br>
<br>
Dan heb je in die folder .txt exports, en die zijn veel makkelijker te<br>
doorzoeken. Als het naar tevredenheid werkt, kan je tzt al je doc en docx<br>
bestanden opruimen. En da's het beste wat je kan doen met gesloten<br>
bestandsformaten.<br>
</blockquote></div>