特定部分の処理と文字列の結合方法について

2008/12/22 21:46

このQ&Aのポイント

文字列の中の特定部分とそうでない部分とで処理を分ける方法と、処理した結果を文字列として結合する方法について教えてください。
例えば、<test>で囲まれた部分は小文字に変換し、囲まれていない部分は大文字に変換したい場合、どのようにすれば良いでしょうか。
現在、preg_match_all()とpreg_replace()を使用して処理を行っていますが、よりスマートな方法があれば教えてください。

文字列の中の特定部分とそうでない部分とで処理を分けたい

文字列中で、<test>～</test>で囲まれた部分と、囲まれてない部分とで処理を分けたいです。そして、分けて処理したあとに、くっつけたいです。 abcdEFG <test> ABCDEFG </test> hiJKLmn ↓ 例えば、<test>で囲まれた部分は小文字に変換、囲まれていない部分は大文字に変換という処理であれば以下のようにしたいのです。 ABCDEFG <test> abcdefg </test> HIJKLMN 扱う文字列は、UTF-8で複数行です。自分でとりあえず動作するコードは作成してはみたものの、、、あまりスマートとはいえないと感じていて、もっといい方法があればご教示お願いしたいです。。。１．文字列Aの中から、<test>で囲まれた部分をpreg_match_all()で取得し、変数Aに格納。２．変数Aに処理を加え、変数Bに代入。３．preg_replace()で文字列Aの中の、変数A部分を変数Bに置換。４．文字列Aを、<test>で囲まれた部分をキーとしてpreg_split()で分解し、変数Aに格納。５．変数Aに処理を加え、変数Bに代入。６．preg_replace()で文字列Aの中の、変数A部分を変数Bに置換。　　$pre1 = array(); 　　$pre2 = array(); 　　preg_match_all("/<test>((.|\r\n|\n)*?)<\/test>/u", $p_string, $pre1); 　　for ( $x = 0; $x < count($pre1[0]); $x++ ) { 　　　　# $pre1[0]ではなく$pre1[1]としてるのは<test>タグを含めないため　　　　$pre2[$x] = $pre1[1][$x]; 　　　　# hoge*()は処理　　　　$pre2[$x] = hoge2( $pre2[$x] ); 　　　　$pre2[$x] = hoge4( $pre2[$x] ); 　　　　# <test>タグを戻して、置換後の文字列完成・・・(1) 　　　　$pre2[$x] = '<test>'.$pre2[$x].'</test>'; 　　　　# 置換パターン・・・(2) 　　　　$pre1[0][$x] = "/" . preg_quote($pre1[0][$x], "/") . "/u"; 　　} 　　# 文字列から、(2)置換パターンを探して、(1)置換後文字列に置き換え　　$p_string = preg_replace( $pre1[0], $pre2, $p_string ); 　　$pre1 = array(); 　　$pre2 = array(); 　　$pre1 = preg_split("/<test>(.|\r\n|\n)*?<\/test>/u", $p_string, -1, PREG_SPLIT_NO_EMPTY); 　　for ( $x = 0; $x < count($pre1); $x++ ) { 　　　　$pre2[$x] = $pre1[$x]; 　　　　# hoge*()は処理　　　　$pre2[$x] = hoge1( $pre2[$x] ); 　　　　$pre2[$x] = hoge2( $pre2[$x] ); 　　　　$pre2[$x] = hoge3( $pre2[$x] ); 　　　　# 置換後の文字列完成・・・(3) 　　　　$pre2[$x] = hoge4( $pre2[$x] ); 　　　　# 置換パターン・・・(4) 　　　　$pre1[$x] = "/" . preg_quote($pre1[$x], "/") . "/u"; 　　} 　　# 文字列から、(4)置換パターンを探して、(3)置換後文字列に置き換え　　$p_string = preg_replace( $pre1, $pre2, $p_string ); 　　# 最後に<test>タグを削除する　　$p_string = preg_replace( "/<test>((.|\r\n|\n)*?)<\/test>/u", $1, $p_string );

karace
お礼率57% (134/234)

PHP
回答数3
ありがとう数4

みんなの回答 （3）
専門家の回答

質問者が選んだベストアンサー

ベストアンサー

nicolish
ベストアンサー率72% (13/18)

2008/12/23 01:32 回答No.3

preg_matchを使う流れに反逆してstrposだけで書いてみた。整理すればもう少し可読性が上がるかもしれない。読みづらい分、速度はかなり出るはず。やってる事は・<test>の前までは大文字に変換・<test>をそのままくっつける・次の</test>までは小文字に変換・</test>をそのままくっつける・残りの部分に対し、ここまでの処理を繰り返し

質問者

お礼 2008/12/24 21:40

ありがとうございました。ソース、参考にさせて頂きました。速度的にもstrpos→substrで切り出した方が速いようで、助かりました。また、細かく文字列を切り分けてから、それぞれに処理を加えられるので参考になりました。 ※実際に切り取った文字列に加える処理は、大文字小文字の変換だけでなく、指定範囲内には処理１と３を、範囲外には２と３と４のようにしていたので、一度文字列を切り出して、処理を終えたら合体という流れにする必要がありました。例に出したのがわかりづらくて申し訳ありませんでした

ログインすると、全ての回答が全文表示されます。

その他の回答 (2)

mpx
ベストアンサー率71% (149/209)

2008/12/23 00:39 回答No.2

このような方法も有ります <?PHP $txt=<<<_EOF_ abcdEFG <test> ABCDEFG </test> hiJKLmn _EOF_; $TXT=strtoupper($txt); $TxT=preg_replace_callback("|(<TEST>\n)(.*?)(</TEST>\n)|sm", "str2Low",$TXT); echo $TxT; function str2Low($x){return strtolower($x[2]);} ?>

質問者

お礼 2008/12/24 21:41

ありがとうございます。ただ、例に出したのがわかりづらかったでしょうか。実際に切り取った文字列に加える処理は、大文字小文字の変換だけでなく、指定範囲内には処理１と３を、範囲外には２と３と４のようにしていたので、一度文字列を切り出して、処理を終えたら合体という流れにする必要がありました。回答頂いたのに申し訳ありません。

ログインすると、全ての回答が全文表示されます。

yambejp
ベストアンサー率51% (3827/7415)

2008/12/22 23:46 回答No.1

どこまで厳密にやりたいかによりますが、ざっくり手を抜いてやるとこんな感じ <? $str=<<<eof aBcD <test> EfgH </test> iJKl <test> MnOp </test> QRst eof; $patterns=Array( '/.*/es' ,'/(<test>)(.*?)(<\/test>)/ies' ); $replacements=Array( "strtoupper('\\0')" ,"'\\1'.strtolower('\\2').'\\3'" ); $str=preg_replace($patterns,$replacements,$str); print $str; ?>