ベストアンサー

特定のWEB上の情報を収集して、自動的にDBに保存する方法

2008/01/26 22:22

特定のWEB上の情報を収集して、自動的にDBに保存する方法を教えてください。たとえば（あくまで例えばですが）、株価情報を株価情報のサイトから取得して、その情報を自前のサーバーのデータベースにいれる、というようなことをしたい考えているとします。 cronを使えば、定期的に何かを実行させることができる、というところまではわかったのですが、それ以上のことがわかりません。おそらく、株価の情報サイトからHTMLのデータをひろってきて、そこから目的の値を抽出するのでしょうが、１、どうやって（どのようなプログラム言語を使って）特定のサイトからHTMLのデータをひろってくるのか２、どうやって（どのようなプログラム言語を使って）HTMLのデータから目的の値を抽出するか３、どうやって（どのようなプログラム言語を使って）抽出した値をDB(mySQL)に保存するかこの３つが特にわからない（知りたい）のです。ちなみに今私が知っている言語は、mySQL,PHP,Cくらいです。また、これを実現しようとしている環境についてですが、OSはUnix系で、レンタルサーバーであるものとします。つまり、データのロードも抽出もDB更新もすべてレンタルサーバー上で行いたいと思っています。

tenketu
お礼率71% (250/348)

その他（プログラミング・開発）
回答数2
ありがとう数5

みんなの回答 （2）
専門家の回答

質問者が選んだベストアンサー

ベストアンサー

gentaro
ベストアンサー率47% (105/221)

2008/01/27 16:26 回答No.2

基本的には、ブラウザを作成する、ということです。 1）ソケットで相手サーバーに接続してhttpリクエストを送る 2）返ってきたレスポンスからHTML記述を解析して欲しい情報を切り出す（スクレイピングという）。この部分は＃１の方の言うとおりモジュールが出回っています。 3）各プログラム言語の方法(MySQLインターフェース）に依存しますスクレイピングの困ったところは、相手先の記述が変わった場合、当然こちら側のプログラムも手直ししなければいけない、という点です。また、正式なブラウズではないので、相手側に迷惑をかけない方法を考慮するのも大事ですね。 Last-Modifiedを見て、更新されていなかったら処理ストップ、など。

質問者

お礼 2008/01/27 16:56

詳しい説明ありがとうございます。これでようやく、勉強を始めることができそうです。

その他の回答 (1)

jjon-com
ベストアンサー率61% (1599/2592)

2008/01/27 12:06 回答No.1

Perl なら WWW::Mechanize というCPANモジュールを使うと思います。関連情報はGoogle検索してみてください。

質問者

お礼 2008/01/27 16:55

ありがとうございます。このキーワードを頼りにこれから勉強していこうと思います。

特定のWEB上の情報を収集して、自動的にDBに保存する方法

質問者が選んだベストアンサー

お礼 2008/01/27 16:56

その他の回答 (1)

お礼 2008/01/27 16:55

関連するQ&A

MySQLのDB内容をWEB上に表示するには、どうしたらいいですか？

WEBのデータを読み込んでDBに登録する方法

自前のＤＢを参照できるＷＥＢサーバー

ネット上から自動的に文字情報を収集したい

レンタルＷＥＢサーバーで自前のＤＢから参照したい

特定のページから自動でデータを取得する

オススメのレンタルサーバーは？

さくらインターネットのDB接続方法

ウェブ上での情報収集に便利なプログラミング言語は？

C#,VB.NETからのウェブDBのメンテは

DBサーバのSlaveサーバへの自動切換えの手法について

Googlemapに位置情報が表示せれないのですが・・・

Ajax、PHP、MySQLでDBからデータをWEB上に表示するサイト

WEB→DBの作成について

PHP,RUBY,Perl,JSPで実現可?

WEBサーバとDBサーバ

WebサーバとDBサーバを用いてファイルを格納したいです、教えてください。

ＷＥＢページの保存

フォーム情報をDBに追加できない

DBアクセスの情報保持したファイルの秘匿化

注目のQ&A

カテゴリ

あなたにピッタリな商品が見つかる！ OKWAVE セレクト

専門家に質問してみよう