[linux] Re: pdf-files bewerken
Hans Paijmans
j.j.paijmans op uvt.nl
Vr Nov 16 12:30:15 CET 2007
Wybo Dekker wrote:
> Hans Paijmans wrote:
>> Wat ik zou willen: bepaalde strings in een pdf-file markeren
>> met kleur, of zelfs een URL aan toevoegen.
>>
>> Dus heb ik eens naar de specificaties van het pdf-format gekeken.
>
> pdf-files zijn niet bedoeld om ge-edit te worden, zeker niet met de
> hand. Je zou het misschien met Acrobat kunnen doen - ik heb er geen
> ervaring mee.
> Maar je kunt natuurlijk wel met pdf[la]tex of met openoffice een
> pdf-file genereren met kleur, links en nog veel meer. Is dat geen optie?
>
Nee, ik heb een retrieval engine gemaakt voor pdf-files. Die files
worden eerst met pdftohtml naar ASCII omgezet, en daarna ge"indexeerd.
Als nu een pagina gevonden is, kan ik met tkpdf of zo de pagina uit de
gehele pdf-file knippen, en laten zien. Maar ik wil de strings die
overeenkomen met het zoekwoord, dan rood laten oplichten.
--
Dr. J.J. Paijmans
Tilburg University: Dept. of Linguistics & AI 013-4662693
Rijksdienst voor Archeologie, Cultuurlandschap en Monumenten 033-4227591
Maastricht University: IKAT, Faculty of General Sciences 043-3883477
Thuis: Kleine St.Jansstraat 3, 3811 HV Amersfoort 033-4722579
http://paai.uvt.nl http://paijmans.net GSM: +31 621 961 083
More information about the Linux
mailing list