• ベストアンサー

HPのソースのURL部分だけを抽出したい

下記のようなソースがあるとします。 <TD><A href="http://www.webconnection.jp/micro/slink/slink.cgi" target=_blank>Web Republick</A></TD> <TD><A href="http://www.webconnection.jp/micro/slink/slink.cgi?mode=form" この中で”で囲まれているURL部分だけを抽出して一覧を作るにはどうしたらいいでしょうか? ワードやエクセルに貼り付けてなんとかしようとしたのですが、うまくゆきません。 URLがたくさんあり、手動でコピペするには手間が多すぎます。 よい方法がありましたら、教えてください。 よろしくお願いします。

質問者が選んだベストアンサー

  • ベストアンサー
  • 2531kbps
  • ベストアンサー率13% (183/1333)
回答No.1

(1) VBAで、それを抽出するVBAプログラムを作る。 (2) ロケットマウスを使い、ダブルコーテーションhttp~次のダブルコーテーションまでを、選択してコピペするマクロ作って1キーで動かす。 (3) たくさんというのが抽象的ですが、いくつ?手動でやったら? (4) 「<TD><A href=」を含む行を、 type fuga.txt | fine "<TD><A href=" > hoge.txt でひろい、「<TD><A href=」をナルに置換する。

その他の回答 (4)

  • cockerel
  • ベストアンサー率46% (253/548)
回答No.5

>2. 最初の「<TD><A href=" 」までを手動で消去します。 ワイルドカードを使用しているので、この部分が削除されていないと、1つて前にずれてしまうため、URLが削除されてしまうことになります。 手動で消去自体まったく手間に感じられないのですが、場所を見つけるためには、 <TD><A href=" で検索し、Sift+ctrl+Homeで先頭まで選択してdeleteすればよいでしょう。

  • cockerel
  • ベストアンサー率46% (253/548)
回答No.4

抜けがありました。 3. ワイルドカードを使用して「"*"」を全置換します。 を 3. ワイルドカードを使用して「"*"」を^pに全置換します。 としてください。 これがないと1行になってしまいます。ごめんなさい。

  • cockerel
  • ベストアンサー率46% (253/548)
回答No.3

1. 全体をWordに貼り付けます。 2. 最初の「<TD><A href=" 」までを手動で消去します。 3. ワイルドカードを使用して「"*"」を全置換します。 4. 「"」前後の半角スペースが規則的に挿入されている場合には(3)の検索文字列に含めることができますが、規則性のないときには含めずに、最後に取り除いた方がよいでしょう。  4.1 半角スペース^pを^pに全置換  4.2 ^p半角スペースを^pに全置換 ( ExcelのTRIMを使用してもよい) おまけ 質問に無関係なときは生アドレスを貼り付けないようにしてください。 せっかくの質問が削除されてしまうことがあります。

yoshinobu_09
質問者

お礼

ありがとうございます。 >2. 最初の「<TD><A href=" 」までを手動で消去します。 ここの部分を自動でできないでしょうか?

  • 2531kbps
  • ベストアンサー率13% (183/1333)
回答No.2

(4)の条件は、その行が、 <TD><A href="http://www.~" となっていることです。 前後に余計な物を含んでいると不可です。

関連するQ&A