- ベストアンサー
Rails 指定Webページの情報取得方法
Ruby on Railsで「はてなブックマーク(http://b.hatena.ne.jp/)」のように、 URLを入力すると、ページタイトル、ページ内容、ページ画像 を取得する方法をご教授お願いします。 参考URL,参考ソースコード(Github等)があれば助かります。
- みんなの回答 (1)
- 専門家の回答
質問者が選んだベストアンサー
ページのHTMLを取得した後、HTMLを解析するツールで情報を切り出します。 切り出しの指定方法は、CSS風とxpathと2通りありますが、xpathが細かい指定ができるので良いと思います。細かい指定をしないのならCSS風が楽か。 ツールとしては、標準添付だとREXML(Rubyで書かれている)。gemだとNokogiri(Cで書かれている)。 いずれもウェブ上にドキュメントがあります。
お礼
ご回答ありがとうございます。 Nokogiriを使用してみたいと思います。