• ベストアンサー

他のサイトを自動引用するスクリプトの例

インターネット上の一定のフォーマットのHTMLの一部を読み込んで、別の形式で表示する方法をチュートリアル形式で手とり足取り教えてくれるサイトもしくは書籍をご紹介いただけますでしょうか(GoogleNewsみたいなものの作り方)。当方の技量はPerlの入門本をやったきり放置 rubyの本をかじり読み、cygwinからbashを使って特定のソフトのバッチを作れるレベルです。特に他のサイトを読み込む部分がわかりませんが、スクリプトで一旦HTMLを落としてやっているもののでしょうか?漠然とした質問ですが、何か例をいただけると助かりますどうぞよろしくお願いします。

質問者が選んだベストアンサー

  • ベストアンサー
回答No.1

> 特に他のサイトを読み込む部分がわかりません perl のLWPというモジュールを使います。 リンク先にあるように Agent を目的のページに飛ばすと、 テキスト(HTML)を拾ってきてくれます。 > 一定のフォーマットのHTMLの一部を読み込んで あとは、テキスト処理なので、perl をいじったことがあるのであれば、ある程度想像が付くのではないかと思いますが、どうでしょう。

参考URL:
http://homepage3.nifty.com/hippo2000/perltips/LWP.html
latifolius
質問者

お礼

ありがとうございます。きちんとモジュールがあったのですね。 あとはHTMLいじれば良いだけなので想像付きます。 ひきつづき書籍やまとまったサイトなどの情報がありましたらお待ちしています。

latifolius
質問者

補足

LWPでぐぐってRubyの例やコミュニティも見つけました。 http://homepage1.nifty.com/kazuf/ruby_awking.html ありがとうございます。

関連するQ&A