[linux] Re: regex vraagje

asmuth op bakunin.xs4all.nl asmuth op bakunin.xs4all.nl
Wo Feb 8 17:44:13 CET 2006


> Mag ik jullie even storen voor een regular expressions gerelateerde vraag?
> ik heb een file met links die ik uit een set html heb gegrept. Dat ziet er
> ongeveer zo uit:  rommel* <a href="/links/die/ik/wil" name="niet
> interessant">de linktekst</a> meer niet interesaante rommel hier met
> <tags>
> en "quotes"
>
> dat wil ik omvormen naar een lijstje met op elke regel
> /links/die/ik/wil |de linktekst

Probeer eens iets in de trant van

sed -n <linkejes..html -e '
/.*<[aA][[:space:]]\+[hH][rR][eE][fF][[:space:]]*=[[:space:]]*"\(.*\)".*>\(.*\)<\/[aA]>/
{
s//\1 \t\| \2/
p }'

(de tweede regel loopt van '/' tot aan '{', maar kan zijn afgekapt.

Let erop dat sed regel-georienteerd is, maar HTML willekeurige regel-
einden kan bevatten, waardoor bovenstaand commando fout kan gaan.

Suc6,



Daniel







More information about the Linux mailing list