• ベストアンサー

Rails 指定Webページの情報取得方法

Ruby on Railsで「はてなブックマーク(http://b.hatena.ne.jp/)」のように、 URLを入力すると、ページタイトル、ページ内容、ページ画像 を取得する方法をご教授お願いします。 参考URL,参考ソースコード(Github等)があれば助かります。

質問者が選んだベストアンサー

  • ベストアンサー
  • notnot
  • ベストアンサー率47% (4900/10358)
回答No.1

ページのHTMLを取得した後、HTMLを解析するツールで情報を切り出します。 切り出しの指定方法は、CSS風とxpathと2通りありますが、xpathが細かい指定ができるので良いと思います。細かい指定をしないのならCSS風が楽か。 ツールとしては、標準添付だとREXML(Rubyで書かれている)。gemだとNokogiri(Cで書かれている)。 いずれもウェブ上にドキュメントがあります。

Bellick
質問者

お礼

ご回答ありがとうございます。 Nokogiriを使用してみたいと思います。

関連するQ&A