ブログのHTMLからtrackback:pingの抽出(HTMLにrdf要素がないブログ)
以前、「ブログのHTMLからtrackback:pingを抽出したい」
http://oshiete1.goo.ne.jp/kotaeru.php3?q=1710072
の質問をしたものです。
前の質問でしたように、一般的なブログでは、trackback ping URLは、
ブログの記事のHTMLの中の、rdf:Description要素の中の、
trackback:pingのところに記述されています。
しかし、上記に当てはまらないブログもありました。
例えば、ヤプログやドリコムブログです。
これらのブログでは、HTML中でrdf:Description要素自体が記述されておらず、
以下のような形でtrackback ping URLが記述されています。
例)ヤプログ(trackback ping URLはhttp://yaplog.jp/example/tb_ping/22)
<html lang="ja">
<head>
<title>
…
<td width="5" background="/blog/template/37/img/entryl.gif"> </td>
<td>
<table width="350" border="0" cellspacing="0" cellpadding="0">
<tr>
<td class="entry_text">
この記事へのトラックバックURL<br />
http://yaplog.jp/example/tb_ping/22<br><br>
<div class="comment_layer">
</div>
</td>
</tr>
</table>
</td>
<td width="5" background="/blog/template/37/img/entryr.gif"> </td>
</tr>
<tr>
…
</body>
</html>
このようなHTMLからtrackback ping URLである、
http://yaplog.jp/example/tb_ping/22を抽出したいです。
ブログの記事のURLを入力して、
そのブログの記事のtrackback ping URLを取得するには、
どのようにプログラムを組めばいいでしょうか?
よろしくお願いします。