- ベストアンサー
※ ChatGPTを利用し、要約された質問です(原文:ブログのHTMLからtrackback:pingの抽出(HTMLにrdf要素がないブログ))
ブログのHTMLからtrackback:pingの抽出(HTMLにrdf要素がないブログ)
このQ&Aのポイント
- ブログのHTMLからtrackback:pingを抽出する方法について説明します。
- 一般的なブログでは、trackback ping URLはrdf:Description要素の中に記述されていますが、一部のブログでは異なる方法で記述されています。
- 具体的には、ヤプログやドリコムブログなどではrdf:Description要素が存在せず、trackback ping URLが直接HTML内に記述されています。プログラムを組んでこのURLを抽出することができます。
- みんなの回答 (1)
- 専門家の回答
質問者が選んだベストアンサー
ドリコムの場合、パターンマッチングを以下のようにすればいいかも・ (ヤプログは、現在メンテナンス中でテストできませんでしたが同じでいけるかと) あとは、WEBサイトの切り分けをURLからやればいいと思います。 ---------------------------------------------------------------- trackBackPing = Pattern.compile("http:.*\\/tb_ping\\/\\d+"); m = trackBackPing.matcher(aLine); if(m.find()){ addr=aLine.substring(m.start(),m.end()); break; }
お礼
ご回答ありがとうございます。 現在はプログラムを実行できる環境にいないので、 プログラムを動作させるまで評価の方はもうしばらくお待ちください。 ありがとうございました。
補足
プログラムを動作させました。 無事TrackBackPingURLを抽出できました。 ありがとうございました。