htmlで記述されたWebページの解析と情報取得
特定のWebページを取得し、その情報の一部を利用したいと思っています。
そのページはXML形式ではなく一般的なhtml形式です。
今はやり方がわからない為、ブラウザに一旦受けさせて
ブラウザの機能でパースしてもらってそれを利用しています。
しかし、スマートではないのでこのやり方から卒業したいと思っています。
(そもそもAjaxじゃないし)
これを(一旦html文字列を取得して)何かのJavaScriptライブラリ等を利用して
「getElementsByName…」等を利用できる形のオブジェクトに
変換したいと思っています。
xmlhttp = new ActiveXObject("Microsoft.XMLHTTP");
xmlhttp.open('GET', …);
…
htmlStr = xmlhttp.responseText; // ←これを使う?
htmlDom = hoge.parse(htmlStr);
htmlDom = xmlhttp.responseHTML; // ←こんな感じのがあれば最高
alert(htmlDom.getElementsByName("…")[0].value);
google提供のライブラリに「GXml.parse」というものがあり、
XML文字列をXML DOM 形式にパースするという機能があります。
これのhtml版はないものかと思っているしだいです。
例えば、以下のページ(どちらでもいい)から為替レートを取得したい場合などです。
外為 レート - Infoseek マネー
http://money.www.infoseek.co.jp/MnForex/fxrate/
外為 米ドル/円 - Infoseek マネー
http://money.www.infoseek.co.jp/MnForex/fxdetail/?fx=F1001
※今回の質問は「どこでもいいから為替レートを取得する方法」ではありません。
知りたいのはhtmlのパース方法です。為替はあくまでも例です。
(Webブラウザにレンダリングさせないで)
html文字列をparseする方法。(JavaScriptライブラリの使用可)
※html文字列からでなくともいい
これを教えてください。よろしくお願いします。