[linux] Linux Verzamelmail, Volume 46, Nummer 12
Mike Jonkmans
nllgg op jonkmans.nl
Ma Jun 22 12:22:56 CEST 2020
Alternatieven:
unzip -p example.docx
unzip -p example.odt
catdoc example.doc
output hiervan: | grep -il fiets --label=example.XYZ
Het kan handig zijn om lesspipe te gebruiken (man lesspipe).
Dan kan je eventueel ook nog een eigen filter maken in ~/.lessfilter,
zodat ook .docx en .odt door lesspipe behandeld worden.
Groetjes, Mike
On Mon, Jun 22, 2020 at 10:13:53AM +0200, paai wrote:
>
> Ik weet niet hoe comfortabel je bent in bash, maar nu heb je twee sets met
> bestanden te beheren, namelijk he Word bestanden en je text bestanden. Dat
> schreeuwt om een scriptje dat on the fly de Wordbestanden converteert en er
> grep op los laat. soffice lijkt me dan een zwaargewicht; zijn er ook
> lichtere programmas die je dan als een filter kunt inbouwen?
>
> Paai
>
>
> On 22-06-2020 09:50, Jan Paul Smit wrote:
> >
> > Beste Geert, Daniel, Gijs en anderen,
> >
> > Het is gelukt!
> >
> > Zoals Gijs voorstelde, heb ik mijn Word-bestanden omgezet naar
> > txt-bestanden via:
> >
> > find . \( -name \*.doc -o -name \*.docx \) -type f -exec soffice
> > --headless --convert-to txt:Text {} \;
> >
> > Nu kan ik ze makkelijk doorzoeken met grep:
> >
> > grep -r -i -l “fiets” /home/jan-paul/Bureaublad/Zoeken
> >
> > Ik krijg dan een keurig lijstje van de bestanden waarin dit woord
> > voorkomt plus het pad. Precies wat ik wou.
> >
> > Hartelijk dank voor jullie hulp!
> >
> > Met vriendelijke groeten, Jan Paul
> >
--
Verzonden vanaf Linux.
Mike Jonkmans <nllgg op jonkmans.nl>
Meer informatie over de Linux
maillijst