[linux] Re: regex vraagje
asmuth op bakunin.xs4all.nl
asmuth op bakunin.xs4all.nl
Wo Feb 8 17:44:13 CET 2006
> Mag ik jullie even storen voor een regular expressions gerelateerde vraag?
> ik heb een file met links die ik uit een set html heb gegrept. Dat ziet er
> ongeveer zo uit: rommel* <a href="/links/die/ik/wil" name="niet
> interessant">de linktekst</a> meer niet interesaante rommel hier met
> <tags>
> en "quotes"
>
> dat wil ik omvormen naar een lijstje met op elke regel
> /links/die/ik/wil |de linktekst
Probeer eens iets in de trant van
sed -n <linkejes..html -e '
/.*<[aA][[:space:]]\+[hH][rR][eE][fF][[:space:]]*=[[:space:]]*"\(.*\)".*>\(.*\)<\/[aA]>/
{
s//\1 \t\| \2/
p }'
(de tweede regel loopt van '/' tot aan '{', maar kan zijn afgekapt.
Let erop dat sed regel-georienteerd is, maar HTML willekeurige regel-
einden kan bevatten, waardoor bovenstaand commando fout kan gaan.
Suc6,
Daniel
More information about the Linux
mailing list