- ベストアンサー
他のサイトを自動引用するスクリプトの例
インターネット上の一定のフォーマットのHTMLの一部を読み込んで、別の形式で表示する方法をチュートリアル形式で手とり足取り教えてくれるサイトもしくは書籍をご紹介いただけますでしょうか(GoogleNewsみたいなものの作り方)。当方の技量はPerlの入門本をやったきり放置 rubyの本をかじり読み、cygwinからbashを使って特定のソフトのバッチを作れるレベルです。特に他のサイトを読み込む部分がわかりませんが、スクリプトで一旦HTMLを落としてやっているもののでしょうか?漠然とした質問ですが、何か例をいただけると助かりますどうぞよろしくお願いします。
- みんなの回答 (1)
- 専門家の回答
質問者が選んだベストアンサー
> 特に他のサイトを読み込む部分がわかりません perl のLWPというモジュールを使います。 リンク先にあるように Agent を目的のページに飛ばすと、 テキスト(HTML)を拾ってきてくれます。 > 一定のフォーマットのHTMLの一部を読み込んで あとは、テキスト処理なので、perl をいじったことがあるのであれば、ある程度想像が付くのではないかと思いますが、どうでしょう。
お礼
ありがとうございます。きちんとモジュールがあったのですね。 あとはHTMLいじれば良いだけなので想像付きます。 ひきつづき書籍やまとまったサイトなどの情報がありましたらお待ちしています。
補足
LWPでぐぐってRubyの例やコミュニティも見つけました。 http://homepage1.nifty.com/kazuf/ruby_awking.html ありがとうございます。