締切済み

正規表現

2006/12/19 23:56

テキストファイルからコメント行以外から文字列"bbb"を含む行をgrepで抽出したいと思っております。コメント行→"#"で始まる行と"--"で始まる行先頭にスペースがある場合もあるので、結局先頭に「0個以上のスペース+（"#"or"--"）」がある行は対象外として、文字列"bbb"を含む行をgrepで抽出したいと思っています。下記、foo.txtの中から下記の抽出対象の2行のみを抽出したい場合、どういった正規表現を書けばいいか教えてください。【foo.txt】 aaa bbb → 抽出対象 aaa bbb →抽出対象 # aaa # bbb →抽出対象外 #aaa # aaa --aaa --aaa -- aaa -- bbb →抽出対象外 -aaa -bbb - aaa ご存じの方がいらっしゃいましたら、よろしくお願い致します。

t29x0479
お礼率8% (11/134)

Linux系OS
回答数3
ありがとう数0

みんなの回答 （3）
専門家の回答

みんなの回答

sakusaker7
ベストアンサー率62% (800/1280)

2006/12/21 00:55 回答No.3

OSがLinux系ということなんで、多分GNU grepなのでegrepでなく grepでもかけると思いますが、ちと表記が面倒なのでegrepで D:\work\mogera>egrep -e "^([^#-].*|-[^-]*)?bbb" foo.txt bbb → 抽出対象 bbb →抽出対象 -bbb 抽出対象? aaabbb がんばればもうちょっと最適化できると思いますが、とりあえずはこんなところでどうでしょう? まああまり条件が複雑になるようなら#2の方のように、-v でのしぼりこみを活用してパイプラインを組むのがわかりやすいと思います。

ログインすると、全ての回答が全文表示されます。

calo9
ベストアンサー率0% (0/0)

2006/12/20 10:07 回答No.2

パイプでつないではいかがでしょう？ yourid% grep bbb foo.txt | grep -ve "^ *--" | grep -ve "^ *#" この例だと、 -bbb は出力します。

ログインすると、全ての回答が全文表示されます。

sakusaker7
ベストアンサー率62% (800/1280)

2006/12/20 00:36 回答No.1

条件がちょっとあいまいです。 >先頭に「0個以上のスペース+（"#"or"--"）」がある行は対象外スペース以外の最初に登場するキャラクタが # もしくは -- のとき対象外ということでいいですか? -- bbb →抽出対象外 -aaa -bbb 下のほうの -bbb は対象になるんですか? bbb → 抽出対象 aaa bbb →抽出対象これ、上も下も bbb で始まる行でいいのでしょうか? 抽出対象と注釈のついている行だけ見ると、 grep '^bbb' で十分なような気がするんですが、それでできない条件はありますか? aaabbb のような、#でも--でもなく空白でもないキャラクタが先行するケースはありますか?

質問者