[linux] Re: pdf-files bewerken

Hans Paijmans j.j.paijmans op uvt.nl
Vr Nov 16 12:30:15 CET 2007


Wybo Dekker wrote:
> Hans Paijmans wrote:
>> Wat ik zou willen: bepaalde strings in een pdf-file markeren
>> met kleur, of zelfs een URL aan toevoegen.
>>
>> Dus heb ik eens naar de specificaties van het pdf-format gekeken.
> 
> pdf-files  zijn niet bedoeld om ge-edit te worden, zeker niet met de
> hand. Je zou het misschien met Acrobat kunnen doen - ik heb er geen
> ervaring mee.
> Maar je kunt natuurlijk wel met pdf[la]tex of met openoffice een
> pdf-file genereren met kleur, links en nog veel meer. Is dat geen optie?
> 

Nee, ik heb een retrieval engine gemaakt voor pdf-files. Die files
worden eerst met pdftohtml naar ASCII omgezet, en daarna ge"indexeerd.

Als nu een pagina gevonden is, kan ik met tkpdf of zo de pagina uit de
gehele pdf-file knippen, en laten zien. Maar ik wil de strings die
overeenkomen met het zoekwoord, dan rood laten oplichten.



-- 
Dr. J.J. Paijmans
Tilburg University: Dept. of Linguistics & AI                013-4662693
Rijksdienst voor Archeologie, Cultuurlandschap en Monumenten 033-4227591
Maastricht University: IKAT, Faculty of General Sciences     043-3883477
Thuis: Kleine St.Jansstraat 3, 3811 HV  Amersfoort           033-4722579
http://paai.uvt.nl     http://paijmans.net          GSM: +31 621 961 083





More information about the Linux mailing list