[linux] Linux Verzamelmail, Volume 46, Nummer 12

Mike Jonkmans nllgg op jonkmans.nl
Ma Jun 22 12:22:56 CEST 2020


Alternatieven:

unzip -p example.docx
unzip -p example.odt
catdoc example.doc

output hiervan: | grep -il fiets --label=example.XYZ

Het kan handig zijn om lesspipe te gebruiken (man lesspipe).
Dan kan je eventueel ook nog een eigen filter maken in ~/.lessfilter,
zodat ook .docx en .odt door lesspipe behandeld worden.

Groetjes, Mike

On Mon, Jun 22, 2020 at 10:13:53AM +0200, paai wrote:
> 
> Ik weet niet hoe comfortabel je bent in bash, maar nu heb je twee sets met
> bestanden te beheren, namelijk he Word bestanden en je text bestanden. Dat
> schreeuwt om een scriptje dat on the fly de Wordbestanden converteert en er
> grep op los laat. soffice lijkt me dan een zwaargewicht; zijn er ook
> lichtere programmas die je dan als een filter kunt inbouwen?
> 
> Paai
> 
> 
> On 22-06-2020 09:50, Jan Paul Smit wrote:
> > 
> > Beste Geert, Daniel, Gijs en anderen,
> > 
> > Het is gelukt!
> > 
> > Zoals Gijs voorstelde, heb ik mijn Word-bestanden omgezet naar
> > txt-bestanden via:
> > 
> > find . \( -name \*.doc -o -name \*.docx \) -type f -exec soffice
> > --headless --convert-to txt:Text {} \;
> > 
> > Nu kan ik ze makkelijk doorzoeken met grep:
> > 
> > grep -r -i -l “fiets” /home/jan-paul/Bureaublad/Zoeken
> > 
> > Ik krijg dan een keurig lijstje van de bestanden waarin dit woord
> > voorkomt plus het pad. Precies wat ik wou.
> > 
> > Hartelijk dank voor jullie hulp!
> > 
> > Met vriendelijke groeten, Jan Paul
> > 

-- 
Verzonden vanaf Linux.
Mike Jonkmans <nllgg op jonkmans.nl>


Meer informatie over de Linux maillijst