[linux] OT: Hoe doen ze dat onder Windows...?

Hans Paijmans j.j.paijmans op uvt.nl
Wo Jul 19 09:01:13 CEST 2006


Off-topic, maar natuurlijk belangrijk voor advocacy-redenen.
(Brrr... wat een Nederlands)

Essentieel voor mijn werk en onderzoek is dat ik honderden
ongestruktureerde teksten zoals verslagen van opgravingen
moet analyseren met als doel om er 'harde' informatie uit
te halen (jaartallen, namen, objecten, materialen...).

Dus vertaal ik word- en pdf files naar ASCII ('for x in
*pdf; do pdftoascii < $x > $y.txt ;done') en ga er dan
op los met een batterij scripts, waarin de gewone
unix-tools de hoofdrol spelen...

Als ik verplicht zou worden om Microsoft te gebruiken,
en geen toegang zou hebben tot bijvoorbeeld Cygwin, zou
ik mijn werk niet meer kunnen doen.

Een vraag die me eigenlijk al jaren bezig houdt, en met
het afschaffen van Unix op onze universiteit ook wel erg
nijpend wordt: hoe doen ze dat dan onder Microsoft, waar
de commandline toch een ondergeschoven kindje is. Is er
onder Microsoft (nog afgezien van het feit dat ASCII-data
al evenzeer taboe schijnen te zijn) een eenvoudig mechanisme
om dezelfde operaties op een groot aantal files uit te
voeren in iets dat met pipes vergelijkbaar is, of ben
je verplicht je in de jungle van DOM te wagen?

Als ik bijvoorbeeld tabellen met eigenschappen maak van
bovengenboemde opgravingsverslagen, moet ik die dan
individueel en met de hand in Excel importeren voor
ik ze bijvoorbeeld op bepaalde kolommen kan sorteren,
dat soort dingen?




-- 
Dr. J.J. Paijmans
Tilburg University: Dept. of Linguistics & AI             013-4662693
Rijksdienst Oudheidkundig Bodemonderzoek                  033-4227591
Maastricht University: IKAT, Faculty of General Sciences  043-3883477
Thuis: Kleine St.Jansstraat 3, 3811 HV  Amersfoort        033 - 4722579
http://paai.uvt.nl     http://paijmans.net        GSM: +31 621 961 083





More information about the Linux mailing list