<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
</head>
<body>
<p><br>
</p>
<div class="moz-cite-prefix">Op 26-11-2022 om 12:41 schreef Guus
Snijders via Linux:<br>
</div>
<blockquote type="cite"
cite="mid:CAHntV0B1RZfT8FDP+p0X-_86VQbNvLkceOaf8MS_WQJ+8xCnbQ@mail.gmail.com">
<meta http-equiv="content-type" content="text/html; charset=UTF-8">
<div dir="auto">
<div>
<div class="gmail_quote">
<div dir="ltr" class="gmail_attr">Op za 26 nov. 2022 11:08
schreef Fred via Linux <<a
href="mailto:linux@lists.nllgg.nl"
moz-do-not-send="true" class="moz-txt-link-freetext">linux@lists.nllgg.nl</a>>:<br>
</div>
<blockquote class="gmail_quote" style="margin:0 0 0
.8ex;border-left:1px #ccc solid;padding-left:1ex">Ik ben
onvolledig geweest met mijn vraagstelling. Ik heb niet
duidelijk <br>
gemaakt dat het mij ging om de source van de url uit de
(alle) html <br>
pagina's.<br>
De dump optie met lynx geeft wel een mooi tekstueel
overzicht van de <br>
urls in de pagina maar niet de broncode. <br>
</blockquote>
</div>
</div>
<div dir="auto"><br>
</div>
<div dir="auto">Ok, dus bij een link naar <a
href="https://www.nllgg.nl" moz-do-not-send="true"
class="moz-txt-link-freetext">https://www.nllgg.nl</a> wil
jij dan meer iets als <a href=<a
href="https://www.nllgg.nl" moz-do-not-send="true"
class="moz-txt-link-freetext">https://www.nllgg.nl</a>><a
href="http://www.nllgg.nl" moz-do-not-send="true">www.nllgg.nl</a></a>,
maar dan wel met alle attributen van dit a element.</div>
<div dir="auto"><br>
</div>
<div dir="auto">Dus meer in de zin van alle HTML elementen van
bepaald type (in dit voorbeeld dus een A tag).</div>
</div>
</blockquote>
<p>Klopt, dat is de bedoeling.<br>
</p>
<blockquote type="cite"
cite="mid:CAHntV0B1RZfT8FDP+p0X-_86VQbNvLkceOaf8MS_WQJ+8xCnbQ@mail.gmail.com">
<div dir="auto">
<div dir="auto"><br>
</div>
<div dir="auto"><br>
</div>
<div dir="auto">Even googlen leverde deze link op: <a
href="https://stackoverflow.com/questions/68153733/parse-html-using-awk"
moz-do-not-send="true" class="moz-txt-link-freetext">https://stackoverflow.com/questions/68153733/parse-html-using-awk</a></div>
<div dir="auto"><br>
</div>
<div dir="auto">Awk zou ook mijn eerste gedachte zijn, maar
misschien is hxselect hier ook juist interessant (geen
ervaring mee, maar de documentatie lijkt veelbelovend).</div>
<div dir="auto"><br>
</div>
<div dir="auto"><br>
</div>
<div dir="auto"><br>
</div>
<div dir="auto">Mvg, Guus</div>
<div dir="auto"><br>
</div>
</div>
</blockquote>
Ik ga hier ook mee aan de slag. Als ik een voor mij werkende
oplossing heb gevonden dan koppel ik dat hier nog terug.<br>
Tot zover bedankt voor jullie input.
<p><br>
mvg, Fred<br>
</p>
</body>
</html>