ベストアンサー

テキストファイルから最後の単語を抜き取りたい

2004/02/24 16:38

1行にスペースで区切られた複数の単語が入った数万行のテキストファイルがあります。この行の最後の単語だけを抜き取って一つのファイルにしたいと思っています。　aaa bbb 123 abc123 ttt 　2222 j ggg (aa) uuu sssss 　hh 　333 ddd ttt 例えば上のようなファイルなら　ttt 　sssss 　hh 　ttt といった感じで。 awk,sed,perlなんかを使ってやろうかと思っているのですが、最後の単語にマッチさせるような正規表現や手法がわからないでいます。すみませんが、ヒントをいただけないでしょうか。

noname#41382

その他（プログラミング・開発）
回答数3
ありがとう数3

みんなの回答 （3）
専門家の回答

質問者が選んだベストアンサー

ベストアンサー

honeorizon
ベストアンサー率70% (197/279)

2004/02/24 16:53 回答No.2

awkなら --------- print $NF --------- だけ。NFは組み込み変数。意味は調べてね。 sed,perlはわかんないや。rubyなら、 ARGF.each do |line| 　ll=line.chomp!.split(" ") 　print ll[ll.size-1],"\n" end とか。 >最後の単語にマッチさせる [^ ]*$ みたいな感じ？でも、マッチさせた物をどうやって変数に入れて、出力するのかわからん。

質問者

お礼 2004/02/24 17:12

ご回答ありがとうございます！ >awkなら >--------- >print $NF > できました！こんな変数があったんですね。 rubyは普段使わないのでまだ試していませんが、覚えてみたいものの１つです。ありがとうございました。

その他の回答 (2)

nightowl
ベストアンサー率44% (490/1101)

2004/02/24 17:23 回答No.3

こんばんは。 Ruby と聞いて黙っちゃいられずのこのこ出てまいりました。 Ruby の別解として、ワンライナー(一行野郎)のご紹介です。 ruby -ane 'puts $F[-1]' file 配列(Array オブジェクト)の添え字として -1 を指定すると最後の要素を取り出すことができます。 Ruby(や Perl)のオートスプリットモードについては参考 URL をご覧ください。 sed ではめんどくさいんですがこうなるでしょうか。 sed 's/.* *$[^ ][^ ]*$$/\1/' file 　　　　　~~(空白２個です) 僭越ながら、HOGERA3 さんのは「print $1」の代わりに「print "$1\n"」を使うとうまくいくでしょう。

参考URL：: http://oshiete1.goo.ne.jp/kotaeru.php3?q=725066

質問者

お礼 2004/02/25 11:47

アドバイスありがとうございます。参考URLも見させて頂きました。初心者の入り口には最適でした！今後sed,awk,perlなどを使ったこういったテキストの編集をごりごりやりたいと思ってます。 rubyも是非覚えていきたいですね。自分で勉強している分には、やりたい事までなかなかたどり着かないのですが、ここで思いもつかない回答をいただくといっきにスキルがあがったような気になります^ ^;) みなさんありがとうございました！