ベストアンサー

※ ChatGPTを利用し、要約された質問です（原文：file_get_contentsで抽出後の処理）

file_get_contentsで抽出後の処理について

2014/10/31 18:26

このQ&Aのポイント

file_get_contents関数を使用してウェブ上のHTMLを抽出し、必要なテーブル部分を取得した後、正規表現を使用してテーブル部分のみを抽出する方法について困っています。
取り出したテキストをsubstr関数を使用して編集しようとしたがうまくいかなかった。
タグと文字列を同時に消す方法がわからない。preg_replaceを使用して正規表現で処理しようとしたが、うまくいかなかった。

file_get_contentsで抽出後の処理

ウェブ上のhtmlをPHPのfile_get_contents関数で抽出し、mb_convert_encodingをした後、必要なテーブル部分を抽出したのですが、その後の処理に困っています。 header("Content-Type: text/html; charset=UTF-8"); $page = file_get_contents ('http://ｘｘｘｘｘｘｘｘｘｘｘｘ.php'); $fp = mb_convert_encoding($page, "UTF-8", "ASCII,JIS,UTF-8,CP51932,SJIS-win"); $text = substr($fp, $letter, $num); substrで取り出した文字列を編集しているのですがうまくいきません。取り出した内容は下記の内容で、これをテーブルの部分だけにしたいです。 preg_replaceを使って正規表現で処理するような気がしたので、色々と試しては見たのですが、タグと文字列を同時に消すことが出来ません。（タグだけを消すことは出来ます） ----------------------------------------------------------- <div id="momiji_box"> <p class="p_menu"><a name=menu_1 id=menu_1> <p> <table class="no_border"> <tr><td class="no_border_td"><h3 id="this_week_flower">洛北</h3></td></tr> </table> <div class="flower_photo"> <br />延暦寺の紅葉</div> <div class="flower_photo"> <br />曼殊院の紅葉</div> <div class="flower_photo"> <br />赤山禅院の紅葉</div> <p style="margin:0 0 10px;" class="c-fix"> </p> <div class="clear_l"></div> <table class="border"> <thead> <tr> <th colspan=2>紅葉の名所</th> <th>電話番号（075）</th> <th>例年の見頃</th> <th>10月30日現在</th> </tr> </thead> <tbody> <tr> <td colspan=2>常照皇寺 </td> <td>853-0003</td> <td>11/上</td> <td>色付き始め</td> </tr> <tr> <td colspan=2>峰定寺 </td> ・・・・・・ /tbody> </table> </div> ----------------------------------------------------------- どうすれば、テーブル部分のみ抽出することができるでしょうか、ご教授宜しくお願いします。【環境】 Windows7 PHP5.3 共用Xserver

牧野結菜（@makino03）
お礼率84% (78/92)

PHP
回答数2
ありがとう数4

みんなの回答 （2）
専門家の回答

質問者が選んだベストアンサー

ベストアンサー

noname#244856

2014/10/31 18:30 回答No.1

$table = preg_match('@<table>.*?</table>@is', $text, $m) ? $m[0] : null;

質問者

お礼 2014/11/10 12:15

ありがとうございます。望んでいた抽出が出来ました。

その他の回答 (1)

krokrokro123
ベストアンサー率13% (3/23)

2014/11/01 00:51 回答No.2

普通、正規表現ではなくてDOM使うだろ。

質問者

お礼 2014/11/10 12:18

お答えを参考に調べてみました。なるほど、DOMの方がいい感じで次の処理に流せるのでよかったです。ありがとうございました。

file_get_contentsで抽出後の処理について

file_get_contentsで抽出後の処理

質問者が選んだベストアンサー

お礼 2014/11/10 12:15

その他の回答 (1)

お礼 2014/11/10 12:18

関連するQ&A

tableのヘッダを固定したい

2つのテーブルの幅を一致させたい

JSFタグ<h:dataTable>でヘッダのcolspan

テキストBOX１個の画面でテキストBOXがリロード。

スクロール付きのテーブルで、内側に線を付ける方法

css テーブルについて

tableヘッダーの縦書き

CSS+HTMLでTBODYスクロールさせたい

HTMLを使って表を作成しているのですが、枠線がキレイに揃いません。

FIREFOXでのテーブル表示崩れについて

ＨＴＭＬ　複雑なテーブルの作成

テーブルの料金表の複雑な記述方法

tableにtable。table同士の間隔を拡大

親要素の除去(Jqueryのunwrapメソッド)

スタイルシートをhead内で定義したい

htmlの記述について

デーブルが延びる

cssでテーブルの位置を設定するには？

HTMLで文とテーブルの間が空く。

css

注目のQ&A

カテゴリ

あなたにピッタリな商品が見つかる！ OKWAVE セレクト

専門家に質問してみよう

file_get_contentsで抽出後の処理について

file_get_contentsで抽出後の処理

質問者が選んだベストアンサー

お礼 2014/11/10 12:15

その他の回答 (1)

お礼 2014/11/10 12:18

関連するQ&A

tableのヘッダを固定したい

2つのテーブルの幅を一致させたい

JSFタグ<h:dataTable>でヘッダのcolspan

テキストBOX１個の画面でテキストBOXがリロード。

スクロール付きのテーブルで、内側に線を付ける方法

css テーブルについて

tableヘッダーの縦書き

CSS+HTMLでTBODYスクロールさせたい

HTMLを使って表を作成しているのですが、枠線がキレイに揃いません。

FIREFOXでのテーブル表示崩れについて

ＨＴＭＬ 複雑なテーブルの作成

テーブルの料金表の複雑な記述方法

tableにtable。table同士の間隔を拡大

親要素の除去(Jqueryのunwrapメソッド)

スタイルシートをhead内で定義したい

htmlの記述について

デーブルが延びる

cssでテーブルの位置を設定するには？

HTMLで文とテーブルの間が空く。

css

注目のQ&A

カテゴリ

あなたにピッタリな商品が見つかる！ OKWAVE セレクト

専門家に質問してみよう

ＨＴＭＬ　複雑なテーブルの作成