• ベストアンサー
※ ChatGPTを利用し、要約された質問です(原文:str_get_htmlがこける原因を知りたい)

str_get_htmlがこける原因を知りたい

このQ&Aのポイント
  • PHPのサイトをスクレイピングしている際に、str_get_htmlが特定のページで失敗する問題が発生しています。
  • さくらのレンタルサーバ スタンダードを使用しており、PHPのバージョンは5.4.22です。
  • $HTML = file_get_contents($url); $encode_HTML = mb_convert_encoding($HTML, 'UTF-8', 'CP932'); $Dom = str_get_html($encode_HTML); の処理で$Domに値が入らないことが確認されています。

質問者が選んだベストアンサー

  • ベストアンサー
noname#244856
noname#244856
回答No.1

再帰上限の問題でしょうか? http://tips.recatnap.info/error_recursion_run_100_simple_html_dom_parser/ 【代替案1: DOMDocument::loadHTMLFile】 http://php.net/manual/ja/domdocument.loadhtmlfile.php $dom = new DOMDocument; @$dom->loadHTMLFile($url); 【代替案2: preg_match】 http://php.net/manual/ja/function.preg-match.php こちらは正規表現の知識が必要となります。

gooishida
質問者

お礼

結果文字コードの問題でしたw エンコーディングするとき、cp932→UTF8にしてましたが、 AUTOにしたら上手くいきました。 ありがとうございました。 --参考にしたサイト-- http://tenifre.hatenablog.jp/entry/2013/04/11/PHP%E3%81%AESimple_HTML_Dom_Parser%E3%81%A7%E3%82%B9%E3%82%AF%E3%83%AC%E3%82%A4%E3%83%94%E3%83%B3%E3%82%B0%E3%81%99%E3%82%8B%E3%81%A8%E3%81%8D%E3%81%AB%E6%B0%97%E3%82%92%E3%81%A4%E3%81%91%E3%82%8B

すると、全ての回答が全文表示されます。

関連するQ&A