[linux] Re: OT: Hoe doen ze dat onder Windows...?
Hans Rood
hansrood op xs4all.nl
Za Jul 22 23:41:50 CEST 2006
Op woensdag 19 juli 2006 09:01, schreef Hans Paijmans:
> Off-topic, maar natuurlijk belangrijk voor advocacy-redenen.
> (Brrr... wat een Nederlands)
>
> Essentieel voor mijn werk en onderzoek is dat ik honderden
> ongestruktureerde teksten zoals verslagen van opgravingen
> moet analyseren met als doel om er 'harde' informatie uit
> te halen (jaartallen, namen, objecten, materialen...).
>
> Dus vertaal ik word- en pdf files naar ASCII ('for x in
> *pdf; do pdftoascii < $x > $y.txt ;done') en ga er dan
> op los met een batterij scripts, waarin de gewone
> unix-tools de hoofdrol spelen...
>
> Als ik verplicht zou worden om Microsoft te gebruiken,
> en geen toegang zou hebben tot bijvoorbeeld Cygwin, zou
> ik mijn werk niet meer kunnen doen.
Er bestaan kits met de gebruikelijke unix-commands die onder DOS werken,
Compleet met ksh, vi, tr, uniq, sed, wk etc. De Mortimer Toolkit MTK
bij voorbeeld. Die was er 15 jaar geleden al en zal nu wel flnk
uitgebreid zijn.
OKay, er zijn wat gotcha's maar bij tekstanalyse zal je daar niet veel
problemen mee hebben denk ik.
groet
hansr
>
> Een vraag die me eigenlijk al jaren bezig houdt, en met
> het afschaffen van Unix op onze universiteit ook wel erg
> nijpend wordt: hoe doen ze dat dan onder Microsoft, waar
> de commandline toch een ondergeschoven kindje is. Is er
> onder Microsoft (nog afgezien van het feit dat ASCII-data
> al evenzeer taboe schijnen te zijn) een eenvoudig mechanisme
> om dezelfde operaties op een groot aantal files uit te
> voeren in iets dat met pipes vergelijkbaar is, of ben
> je verplicht je in de jungle van DOM te wagen?
>
> Als ik bijvoorbeeld tabellen met eigenschappen maak van
> bovengenboemde opgravingsverslagen, moet ik die dan
> individueel en met de hand in Excel importeren voor
> ik ze bijvoorbeeld op bepaalde kolommen kan sorteren,
> dat soort dingen?
More information about the Linux
mailing list