締切済み

perlの正規表現で...

2008/03/01 13:38

perlの正規表現で... abc (123) abc(123) からabcだけを取り出したいのですが、どのような正規表現になりますでしょうか？よろしくお願いします。

R2D2C3PO
お礼率46% (19/41)

その他（プログラミング・開発）
回答数6
ありがとう数1

みんなの回答 （6）
専門家の回答

みんなの回答

sakusaker7
ベストアンサー率62% (800/1280)

2008/03/01 19:32 回答No.6

予想外の追加条件がでてきてコメカミあたりが緊張しましたが、もうないでしょうね？これから何時間かかけませんができますよ。本当にもう追加がないかよく確認してください

質問者

お礼 2008/03/01 20:20

その後 ([^\(]*)( *(?=\()|) で、なんとかできました。皆さん、いろいろヒント下さり有難うございました。

質問者

補足 2008/03/01 20:08

度々お付き合い下さりありがとうございます。 >本当にもう追加がないかよく確認してくださいありません、（、と思います、あってもいい加減、聞けません）今後はもう少し質問の内容をまとめてからにするよう反省しています。

beefisdead
ベストアンサー率63% (92/145)

2008/03/01 16:42 回答No.5

そろそろ条件が出揃ってると良いんですが… (- -;) '(' が２バイト文字の２バイト目に存在しない前提なら、非欲張り型を使って先頭から検索で ^([^\(]+?)\s*\( でできます。先頭^は環境とお好みで。 '(' が２バイト目に存在するような文字コードだったら？というマルチバイト部分の処理は、業務でもなければやりたくありません（笑）。

質問者

補足 2008/03/01 18:18

> マルチバイト部分の処理は、業務でもなければやりたくありません（笑）そういったレベルではないので、アドバイスいただいた正規表現で構わないのですが、前提としてカッコがない場合もあるので困ってます。例えば、補足はありがとうポイントを発行する (回答を締切る) であれば、補足はありがとうポイントを発行するまでで（カッコ前の空白は含めない）補足はありがとうポイントを発行する回答を締切るならば、最後まで全部という具合にしたいのですが。

sakusaker7
ベストアンサー率62% (800/1280)

2008/03/01 16:16 回答No.4

・一行に複数の対象が含まれる可能性はあるか? ・行頭に空白がある場合その空白の扱いは? ・タブの扱いは? use strict; my $pat = qr<[^(]+(?= *\()>; while (my $line = <DATA>) { my @matches = $line =~ /$pat/g; print join(" : ", @matches), "\n" if @matches; } __END__ abc(123) abc (123) abcd(256) ab cd ef( ab cd ef ( 実行結果: abc abc abcd ab cd ef ab cd ef

質問者

補足 2008/03/01 18:06

有難うございます > 一行に複数の対象が含まれる可能性はあるか? > 行頭に空白がある場合その空白の扱いは? > タブの扱いは? ・ありません・無視で・タブ含まれる可能性はありません今更ながらで恐縮ですが、文字列中にカッコが存在しない場合もあります。カッコが存在すればその手前の文字列まで、かつ、カッコ前の文字列が空白ならばさらにその手前の文字列までとしたいところです。

beefisdead
ベストアンサー率63% (92/145)

2008/03/01 15:38 回答No.3

・カッコの前までを取得・カッコの前には空白文字がいくらあっても良い・取得する部分にはカッコとスペースは含めないを表現するんですから、 ([^\s\(]+)\s*\( とか。（\s : 空白文字）もしも関数名を拾いたいということでしたら、[^\s\(]の代わりに\wを使えば良いのでは。(\w : [a-zA-Z0-9_]と等価) (\w+)\s*\( などのように。

質問者

補足 2008/03/01 15:48

ありがとうございます。取り出したい文字列には空白が含まれている場合もあり ([^\s\(]+)\s*\( とはできません。 abc( -> abc abc ( -> abc ab cd ef( -> ab cb ef ab cd ef ( -> ab cb ef という形にしたいのですがまた、文字列は2バイト文字も含まれるので\wは使えません

sakusaker7
ベストアンサー率62% (800/1280)

2008/03/01 15:11 回答No.2

>文字列中にカッコがあった場合その手前までの文字列を切り出したい 123は関係ないのですか? >カッコがあった場合その手前までで、かつカッコの手前に空白があった場合にはその空白の手前までとしたいということなら use strict; my $pat = qr<abc(?= ?\()>; while (my $line = <DATA>) { my @matches = $line =~ /$pat/g; print join(" : ", @matches), "\n" if @matches; } __END__ abc(123) abc (123) abcd(256) abc(123),abc(234),abc(345) 実行例： abc abc abc : abc : abc こんなところで。

質問者

補足 2008/03/01 15:32

不特定の文字列の繰り返しという意味で、「abc」としましたが、分かりづらいようですいません。また、カッコ内の文字列も同様に不特定でカッコが閉じられているかも不特定です。 .*(?= ?\() というのも試しましたが、この場合もやはり空白を拾ってしまいます。

notnot
ベストアンサー率47% (4900/10358)

2008/03/01 13:49 回答No.1

abcとは？？？？？ abc という固定文字列？ aで始まりcで終わる英字列？先頭から3文字？英数字すべて？先頭から開き括弧の直前まで？・・・・

質問者

補足 2008/03/01 13:53

言葉足らずのいい加減な質問で申し訳ありません。 abcも123も任意の文字列で文字数も不特定です。文字列中にカッコがあった場合その手前までの文字列を切り出したいのですが、 ([^\(]*) にするとカッコの手前の空白も拾うことになってしまいます。カッコがあった場合その手前までで、かつカッコの手前に空白があった場合にはその空白の手前までとしたいのですが・・