Inndata / HTML

Uttrekkede URL-er

Hva er en URL-uttrekker?

En URL-uttrekker skanner tekst eller HTML og henter ut hver http://- og https://-lenke den finner. Nyttig for:

  • Revisjon av alle utgående lenker i et innhold
  • Uttrekk av lenker fra skrapet HTML eller e-post
  • Bygging av en URL-liste for batch eller validering
  • Finne alle bilde- eller skriptkilder på en HTML-side

Verktøyet bruker regulære uttrykk for å matche HTTP- og HTTPS-URL-er i inndata. Duplikater fjernes automatisk. Utdata har én URL per linje, klar til kopiering eller nedlasting.

Slik bruker du verktøyet

1

Lim inn innhold

Lim inn tekst, HTML-kilde, e-post eller logg i venstre editor. Verktøyet trekker ut alle http://- og https://-URL-er mens du skriver.

2

Gjennomgå uttrekkede URL-er

Høyre panel viser hver unike URL på egen linje med antall i panelets overskrift. Duplikater fjernes automatisk.

3

Kopier eller last ned

Klikk Kopier for å legge alle URL-er på utklippstavlen, eller Last ned for å lagre som extracted-urls.txt. Du kan deretter validere hver URL med URL-validator.

Uttrekkingseksempel

Eksempel: Trekk ut URLer fra et blogginnlegg

Inndatatekst:

Check out the docs at https://developer.mozilla.org/en-US/docs/Web/API and the source at https://github.com/angular/angular. See also http://example.com/path?q=1#section

Uttrukne URLer:

https://developer.mozilla.org/en-US/docs/Web/API
https://github.com/angular/angular
http://example.com/path?q=1#section

Ofte stilte spørsmål

Henter den URL-er fra HTML-attributter?

Ja. Verktøyet henter ut strenger som starter med http:// eller https://, også inne i HTML-tagger som href="", src="" og data-url="".

Hva med relative URL-er som /about eller ./image.png?

Verktøyet henter kun absolutte URL-er som starter med http:// eller https://. Relative URL-er hentes ikke fordi de er tvetydige uten basis-URL.

Relaterte verktøy