• ベストアンサー
※ ChatGPTを利用し、要約された質問です(原文:PHPでhtmlファイル群から要素の中身を取出す)

PHPでhtmlファイル群から要素の中身を取出す

このQ&Aのポイント
  • Windows版PHP(cli_php)を使って、あるフォルダ配下のhtmlファイル(深いサブディレクトリにもあり)の、URL、ファイル名、<title>の中身、<h1>の中身、<meta name="keywords" content="ここの中身">、<meta name="decripition" content="ここの中身">を取得する方法を教えてください。
  • <meta name="keywords" content="ここの中身">のキーワードの個数と、<h1>の中身が全角26文字(半角2文字=全角1文字計算)以内かどうかを判別する方法を教えてください。
  • あるフォルダ配下のhtmlファイル(深いサブディレクトリにもあり)から要素の中身を取得する方法や、<meta name="keywords" content="ここの中身">のキーワードの個数と、<h1>の中身が指定の文字数以内かどうかの判別方法を教えてください。一覧はCSV形式で抽出したいです。

質問者が選んだベストアンサー

  • ベストアンサー
  • shimix
  • ベストアンサー率54% (865/1590)
回答No.1

>深いサブディレクトリのhtmlファイルを読み取るのが(ディレクトリのループ) >かなり忘れているので、これをお教えいただけると幸いです。 マニュアルのglobのところにサンプルがあります。 http://php.net/manual/ja/function.glob.php 多分、こんな感じで取得出来るんじゃないかと。 <?php $array = glob_recursive('*.html'); print "<pre>"; print_r($array); print "</pre>"; function glob_recursive($pattern, $flags = 0) { $files = glob($pattern, $flags); foreach (glob(dirname($pattern).'/*', GLOB_ONLYDIR|GLOB_NOSORT) as $dir) { $files = array_merge($files, glob_recursive($dir.'/'.basename($pattern), $flags)); } return $files; }

関連するQ&A