ベストアンサー

※ ChatGPTを利用し、要約された質問です（原文：このPHPの実行時間が異常に長くなってしまう原因はどこでしょうか？）

PHP実行時間の原因と対策

2010/05/23 17:06

このQ&Aのポイント

PHPの実行時間が異常に長くなる原因を特定するために、いくつかの処理を行っています。
具体的には、SimpleXML関数を使用してブログのRSSを取得し、各記事をループして本文を抽出し、200文字までの抜粋を作成しています。
抜粋した文章をNグラム法で分解し、MySQLにフルテキストインデックスとして挿入しています。

このPHPの実行時間が異常に長くなってしまう原因はどこでしょうか？

このPHPの実行時間が異常に長くなってしまう原因はどこでしょうか？ [1] SimpleXML関数でブログのRSSを取得 [2] ブログの各記事(RSS中の<item>～</item>内)をforeachでループ foreach($xml->…->item as $item) [3] 記事の本文の改行を消去した上で先頭から200文字を取得 $description = mb_substr(mb_str_replace(array("\r\n","\r","\n"),'',$item->description),0,200,'UTF-8') [4] 抜粋した200文字をNグラム法で分解 $ngram = $ngram->to_fulltext($description,'4') [5] 分解した文章をフルテキストインデックスに設定したMySQLにINSERT ※[3]～[5]を数十回ループします ※mb_str_replaceはこちらを使わせていただいております http://fetus.k-hsu.net/document/programming/php/mb_str_replace.html ※Nグラム法に関してはこちらを使わせていただいております http://www.tatamilab.jp/rnd/archives/000390.html ※Nグラムクラスの定義は[1]と[2]の間でしています処理開始時と、各処理終了時にmicrotime()で時間を取得し、その差を表示させてみたところ、以下のようになりました SimpleXMLでRSSを取得 0.462195 Nグラム法のクラス定義 0.462571 1ループ目開始 0.462877 Nグラム法で分解 0.462877 INSERT終了 0.464095 2回目のループを開始 0.464107 Nグラム法で分解 0.464593 INSERT終了 0.464684 3回目のループを開始 0.464714 Nグラム法で分解 0.465141 INSERT終了 0.46522 4回目のループを開始 0.465229 Nグラム法で分解 0.465851 INSERT終了 0.465942 5回目のループ開始 0.466016 Fatal error: Maximum execution time of 100 seconds exceeded in /home/***/include/include.php on line 53 上記のように表示されましたなお、ローカル(XAMPPで構築した環境)では数十回のループが正常に処理されます(時間切れになったことはありません) include.phpは上記のmb_str_replace関数の定義部分で、「$index = -1;」の部分です。何度か時間を置いて繰り返し実行してみましたが、mb_str_replaceの定義部分でつっかえているようです。長くなってしまいましたが、何が原因なのかアドバイスをいただければと思います。よろしくお願いします。

php_noob
お礼率42% (15/35)

PHP
回答数2
ありがとう数7

みんなの回答 （2）
専門家の回答

質問者が選んだベストアンサー

ベストアンサー

noname#243182

2010/05/24 01:07 回答No.1

大変興味があります。問題の箇所が独自に定義された関数であり、またそれの利用方法についても改行を取り除くだけということですので、一度これを標準関数に置き換えてはいかがでしょうか。改行を取り除くだけであれば、例2 の方法でよいと思います。 http://jp.php.net/manual/ja/function.str-replace.php また、処理が中断されてしまう箇所にエラー情報を収集するコードをもう少し書き足してみたり、ポイントごとにログを書き出すようにしたりすると、様子がはっきりするかもしれません。 http://jp.php.net/manual/ja/book.errorfunc.php いつも 5回目のループでこけるのか、それとも特定のフィードでたまたま 5番目の記事でこけたのか、そのあたりも気になります。はじめのフィード取得でデータが壊れていないかも確認したいところです。フィードの文字コードセットを取得して、設定できる関数には極力これを設定するというのが大事かもしれないですね。しかし、まずは改行を取り除く部分だけとりあえず標準関数にしてみてはいかがでしょうか。

質問者

お礼 2010/05/25 19:31

回答ありがとうございました！

質問者

補足 2010/05/24 04:07

回答ありがとうございました。まず回答について補足させていただきます。・いつも特定の記事でこけているようです。・はじめのフィード取得で実際にはfile_get_contentsした後に、文字コードの確認、制御文字や不完全なマルチバイト文字等の基本的なチェックをした後、 simplexml_load_stringでオブジェクト化しています。・(しかしバイナリセーフでない関数で定義されているmb_str_replaceでNULLバイト文字のチェックをしていたので意味がありませんでした) ・質問投稿後、mb_str_replaceをstr_replaceに置き換えたところ、問題なく動作することが確認できました。・しかし不安なのでu修飾子をつけたpreg_replaceに置き換えました（問題なく動作しました）次に、質問の追加をさせていただきたいと思います。正規表現置換ではマルチバイト対応の関数でないと文字化けするとよく注意書きがありますが、今回のようにマルチバイト文字が含まれる文字列から、マルチバイトではない文字を置き換える場合、マルチバイトに対応していないstr_replaceが文字化けの原因になることはありますか？

その他の回答 (1)

noname#243182

2010/05/25 11:11 回答No.2

特定の制御文字を除去したいだけであれば「str_replace()」で問題は発生しないと思います。ただ、有名なオープンソース SNS でのフィルタリング処理を見ますと「preg_replace()」の u 修飾子つきでしたので、読み込んだフィードが UTF-8 で記述されている限りは、これに倣うのがよいかもしれませんね。「str_replace()」や「preg_replace()」が制御文字をどのような方法で発見するのかは、ソースを読めばわかると思うのですが、これはやっていません。安心がほしい場合はこのあたりを確認してみてください。あと、出来れば一問一答形式でお願いします。

PHP実行時間の原因と対策

このPHPの実行時間が異常に長くなってしまう原因はどこでしょうか？

質問者が選んだベストアンサー

お礼 2010/05/25 19:31

補足 2010/05/24 04:07

その他の回答 (1)

関連するQ&A

ＰＨＰです２つのスクリプトの相違がわかりません

executeの実行が一回しかされない

動的なPHPを静的なhtmlページに変換したい

AIは使う人の年齢や市場にも影響する？人工知能の可能性

php5.3.3でeregをループ内で使用すると

PHPパーサー　MagpieRSSについて

preg_replaceで連続した改行

sjisで書いているPHPとeucのＭｙｓｑｌでの不都合

初めてばかりのPHPでメールフォーム作ったのですが

ループ内での後方参照の使用に関して

phpで作成したファイルをシェルで読み込むと最後の行を読み込めない

[PHP]formのtextareaの改行を消せない

配列をmb_ereg_replaceで一気に置き換えるには？

PHP+mySQLでのCSV→DB登録で文字化けします

PHP5+MySQL5 CSVから、更新、追加する処理の書き方

TEXTAREAに書いた改行コードを正しくBRに

MagpieRSSでRSSを取得し、ランダムに表示

同条件で連続grepすると2回目がHITしない

改行コードの<BR>への変換がうまくいきません。

PHPでのフォーム送信・・・・

スクリプトの解説してもらいたいのですが・・

注目のQ&A

カテゴリ

あなたにピッタリな商品が見つかる！ OKWAVE セレクト

専門家に質問してみよう

PHP実行時間の原因と対策

このPHPの実行時間が異常に長くなってしまう原因はどこでしょうか？

質問者が選んだベストアンサー

お礼 2010/05/25 19:31

補足 2010/05/24 04:07

その他の回答 (1)

関連するQ&A

ＰＨＰです２つのスクリプトの相違がわかりません

executeの実行が一回しかされない

動的なPHPを静的なhtmlページに変換したい

AIは使う人の年齢や市場にも影響する？人工知能の可能性

php5.3.3でeregをループ内で使用すると

PHPパーサー MagpieRSSについて

preg_replaceで連続した改行

sjisで書いているPHPとeucのＭｙｓｑｌでの不都合

初めてばかりのPHPでメールフォーム作ったのですが

ループ内での後方参照の使用に関して

phpで作成したファイルをシェルで読み込むと最後の行を読み込めない

[PHP]formのtextareaの改行を消せない

配列をmb_ereg_replaceで一気に置き換えるには？

PHP+mySQLでのCSV→DB登録で文字化けします

PHP5+MySQL5 CSVから、更新、追加する処理の書き方

TEXTAREAに書いた改行コードを正しくBRに

MagpieRSSでRSSを取得し、ランダムに表示

同条件で連続grepすると2回目がHITしない

改行コードの<BR>への変換がうまくいきません。

PHPでのフォーム送信・・・・

スクリプトの解説してもらいたいのですが・・

注目のQ&A

カテゴリ

あなたにピッタリな商品が見つかる！ OKWAVE セレクト

専門家に質問してみよう

PHPパーサー　MagpieRSSについて