[linux] url offline extraheren

Guus Snijders gsnijders op gmail.com
Vr Nov 25 17:23:02 CET 2022


Op vr 25 nov. 2022 17:12 schreef Fred via Linux <linux op lists.nllgg.nl>:

> Beste lijst,
>
>
> Ik wil graag uit een aantal html pagina’s die lokaal in een ~/intranet dir
> staan de urls kopieren.
> Het doel hiervan is deze dan te gebruiken als index of sitemap zodat ik
> sneller kan vinden wat ik zoek.
>
> [...]
>
> Kan iemand mij wat tips geven om de urls met grep of een ander (offline)
> hulpmiddel specifieker te filteren?
>

Ik denk dat je lynx zoekt.

Lynx is een text-mode browser, volgens mij doet de -dump parameter zo
ongeveer wat je zoekt.

Maar het zou kunnen dat ik nu links en lynx door elkaar haal. De eerste is
een iets moderne uitvoering van de eerste.


In het verleden heb ik precies dezelfde acties ook al eens uitgevoerd, maar
heb die scripts nu niet bij de hand.



Mvg, Guus Snijders
------------- volgend deel ------------
Een HTML-bijlage is gescrubt...
URL: <https://lists.nllgg.nl/pipermail/linux/attachments/20221125/97691a05/attachment.htm>


Meer informatie over de Linux maillijst