入力テキスト / HTML

抽出されたURL

URL抽出とは?

URL抽出ツールはテキストまたはHTMLのブロックをスキャンし、見つかったすべてのhttp://およびhttps://リンクを抽出します。次の場合に便利です:

  • コンテンツブロック内のすべての外部リンクを監査
  • スクレイプしたHTMLやメール本文からリンクを抽出
  • バッチ処理や検証用のURLリストを構築
  • HTMLページ内のすべての画像やスクリプトのソースを検索

ツールは正規表現を使用して入力内のHTTPおよびHTTPS URLを照合します。重複URLは自動的に削除されます。出力は1行に1つのURLで、コピーまたはダウンロードの準備ができています。

このツールの使い方

1

コンテンツを貼り付け

テキスト、HTMLソース、メールコンテンツ、またはログファイルを左のエディターに貼り付けます。入力すると、ツールは自動的にすべてのhttp://およびhttps:// URLを抽出します。

2

抽出されたURLを確認

右のパネルには、各一意のURLが独自の行に表示され、合計数がパネルヘッダーに表示されます。重複は自動的に削除されます。

3

コピーまたはダウンロード

コピーをクリックしてすべてのURLをクリップボードにコピーするか、ダウンロードextracted-urls.txtとして保存します。各URLはURLバリデーターで検証できます。

抽出例

例:ブログ記事の一部からURLを抽出する

入力テキスト:

Check out the docs at https://developer.mozilla.org/en-US/docs/Web/API and the source at https://github.com/angular/angular. See also http://example.com/path?q=1#section

抽出されたURL:

https://developer.mozilla.org/en-US/docs/Web/API
https://github.com/angular/angular
http://example.com/path?q=1#section

よくある質問

HTML属性からURLを抽出しますか?

はい。ツールは入力からhttp://またはhttps://で始まる任意の文字列を抽出します。これにはhref=""src=""data-url=""などのHTMLタグ内のものも含まれます。

/aboutや./image.pngのような相対URLは?

このツールはhttp://またはhttps://で始まる絶対URLのみを抽出します。相対URLはベースURLがわからないと曖昧なため、抽出されません。

関連ツール