※ ChatGPTを利用し、要約された質問です(原文:PHPでHTMLファイルを解析して配列へ・・・)
PHPでHTMLファイルを解析して配列へ...
このQ&Aのポイント
PHPを使用して、外部から取得したHTMLファイルを解析し、MySQLに格納する方法について考えています。
HTMLファイルの記述が一行で書かれているため、strstrとstr_replaceを使用して解析する必要があります。
解析した結果を多次元配列に格納し、カテゴリとタイトルを出現順に保存したいです。
phpを使用して、下記のhtmlファイルを外部から取得して、解析してMySQLに格納したいと考えています。
問題となったのは、全部の記述が一行で書かれているので、strstrで探してstr_replaceで書き換えて・・・
といった作業をどのようにしていいかわかりません。
結果的には、出現順に多次元配列に$hairetu[] = array(categ => 【カテゴリ】, url => 'http://xxxxxxx.xx' , title => 【タイトル】);という形で収めていきたいです。
以下、解析元ファイルの記述例ですが、このような形式で1000件以上はあります。
<font color="#000000">【カテゴリ】</font><br><a href="http://xxxxxxx.xx">【タイトル】</a><br>【リンク先説明・・・】<br><font color="#000000">【カテゴリ2】</font><br><a href="http://xxxxxxx2.xx">【タイトル2】</a><br>【リンク先説明・・・2】<br>...
お礼
なるほど。 法則性があるので、正規表現の上記の方法でなんとか出来ました。 思った通りに動いたので感動しました! ありがとうございます。 もっと勉強します・・・ preg_match_all()あなどれませんね