<div dir="auto"><div><div class="gmail_quote"><div dir="ltr" class="gmail_attr">Op za 26 nov. 2022 11:08 schreef Fred via Linux <<a href="mailto:linux@lists.nllgg.nl">linux@lists.nllgg.nl</a>>:<br></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Ik ben onvolledig geweest met mijn vraagstelling. Ik heb niet duidelijk <br>
gemaakt dat het mij ging om de source van de url uit de (alle) html <br>
pagina's.<br>
De dump optie met lynx geeft wel een mooi tekstueel overzicht van de <br>
urls in de pagina maar niet de broncode. <br></blockquote></div></div><div dir="auto"><br></div><div dir="auto">Ok, dus bij een link naar <a href="https://www.nllgg.nl">https://www.nllgg.nl</a> wil jij dan meer iets als <a href=<a href="https://www.nllgg.nl">https://www.nllgg.nl</a>><a href="http://www.nllgg.nl">www.nllgg.nl</a></a>, maar dan wel met alle attributen van dit a element.</div><div dir="auto"><br></div><div dir="auto">Dus meer in de zin van alle HTML elementen van bepaald type (in dit voorbeeld dus een A tag).</div><div dir="auto"><br></div><div dir="auto"><br></div><div dir="auto">Even googlen leverde deze link op: <a href="https://stackoverflow.com/questions/68153733/parse-html-using-awk">https://stackoverflow.com/questions/68153733/parse-html-using-awk</a></div><div dir="auto"><br></div><div dir="auto">Awk zou ook mijn eerste gedachte zijn, maar misschien is hxselect hier ook juist interessant (geen ervaring mee, maar de documentatie lijkt veelbelovend).</div><div dir="auto"><br></div><div dir="auto"><br></div><div dir="auto"><br></div><div dir="auto">Mvg, Guus</div><div dir="auto"><br></div><div dir="auto"><div class="gmail_quote"><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
</blockquote></div></div></div>