[linux] url offline extraheren

Fred linuks op freedom.nl
Vr Nov 25 17:12:36 CET 2022


Beste lijst,


Ik wil graag uit een aantal html pagina’s die lokaal in een ~/intranet 
dir staan de urls kopieren.
Het doel hiervan is deze dan te gebruiken als index of sitemap zodat ik 
sneller kan vinden wat ik zoek.

Met de weinig tot geen kennis of ervaring met de cli heb ik een poging 
gedaan met grep -i "<a href" *.html.

Dit geeft dan veel regels terug even zoveel minder relevante informatie.

Kan iemand mij wat tips geven om de urls met grep of een ander (offline) 
hulpmiddel specifieker te filteren?


Gr Fred
------------- volgend deel ------------
Een HTML-bijlage is gescrubt...
URL: <https://lists.nllgg.nl/pipermail/linux/attachments/20221125/a7690bdb/attachment.htm>


Meer informatie over de Linux maillijst