• ベストアンサー
※ ChatGPTを利用し、要約された質問です(原文:特定のサイトからの情報の取得について)

特定のサイトからの情報の取得について

このQ&Aのポイント
  • 特定のサイトから情報を取得する方法について調査しています。サイトがリニューアルした場合でも改修が発生しない方法はあるのでしょうか?
  • 現在、許可を得て、あるサイトから商品名等の情報を取得しています。取得方法としては、PHP cURL関数を用いてページ情報を取得し、正規化して必要な情報を取得しています。
  • しかし、サイトがリニューアルするごとに正規化の改修が必要となっており、固定のタグやid、class名をつけることが難しい状態です。改修が発生しない方法があれば教えてください。

質問者が選んだベストアンサー

  • ベストアンサー
回答No.2

元サイトがリニューアルされたら 処理の書き直しが発生するのは不可避だけど simple html dom 使えばリニューアルへの対応が ある程度は簡単になるかも? でも処理がクソ重たいのでアクセスのたびに スクレイピングするような仕様にはしないのが吉

参考URL:
http://simplehtmldom.sourceforge.net
toema
質問者

お礼

ご回答ありがとうございます。 参考にいたします。

その他の回答 (1)

  • t_ohta
  • ベストアンサー率38% (5241/13712)
回答No.1

cURL 以外なら file_get_contents(); を用いて取得する方法もあります。 http://jp2.php.net/manual/ja/function.file-get-contents.php HTMLの解析は DOM ライブラリを使うと言った方法もありますが、そもそもの構造が変わってしまうような変更をされると対応できないのは仕方ないと思います。 http://php.net/manual/ja/book.dom.php

toema
質問者

お礼

ご回答ありがとうございます。 参考にいたします。

関連するQ&A