• 締切済み

PHPについての質問です。

Web上のHTMLファイルの文字データを取得するにはどうすればいいですか? Web上のHTMLファイルを取得して、その中のタグとかを判別して、 最終的には自分のニコニコ動画の履歴の動画のタグ情報を自動で取得してくれるようなプログラムを作りたいです。 雛型でもいいので教えてください!

みんなの回答

回答No.2
noname#244856
noname#244856
回答No.1

質問者さんがやろうとされていることは一般的に「スクレイピング」と呼ばれます。 検索するときに役立つので言葉を覚えておいてください。 file_get_contents() でデータを取得 http://php.net/manual/ja/function.file-get-contents.php ↓ preg_match() や preg_match_all() などを活用して「正規表現」で必要な部分を抽出 第3引数にキャプチャパターンを使ってキャプチャした内容が格納される http://php.net/manual/ja/function.preg-match.php http://www.php.net/manual/ja/function.preg-match-all.php もしくは DOMドキュメントとしてloadHTMLメソッドで読み込んで使う http://php.net/manual/ja/domdocument.loadhtml.php 「正規表現」の扱いは結構慣れが必要ですが慣れれば簡単です。 頑張って覚えてみてください。 http://nyakaman.sakura.ne.jp/tag/preg_match/ http://qiita.com/mpyw/items/8dd5378cb01c877e1f7b

関連するQ&A