ベストアンサー

Linuxシェルによる同一文字列のカウント集計

2009/02/25 19:37

あるファイル中の同じ文字列の行をカウントしてそれぞれの文字列が何回現れるか集計するシェルを作ろうとしています。しかし、最後のグループの集計がうまくいきません。入力ファイルはソート済みです。スコープの問題なのかどうか良くわかりませんが、想定外の動きをします。このシェルの修正もしくは、別のいい集計方法、どちらでも歓迎です。よろしくお願いします。書いてみたシェル ------------------ #!/bin/sh TARGET_STR=`head -n 1 uniqData.txt` declare -i COUNT=0 cat uniqData.txt | while read LINE_STR do if [ "${TARGET_STR}" = "${LINE_STR}" ]; then COUNT=$COUNT+1 else echo $TARGET_STR：$COUNT TARGET_STR=${LINE_STR} COUNT=1 fi done echo $TARGET_STR：$COUNT ------------------ 入力ファイル ------------------ asd asd asd dfg dfg gghhjj gghhjj gghhjj gghhjj ttyyuuu ttyyuuu ttyyuuu wwee ------------------ 期待出力 ------------------ asd：3 dfg：2 gghhjj：4 ttyyuuu：3 wwee：1 ------------------ 実際の出力 ------------------ asd：3 dfg：2 gghhjj：4 ttyyuuu：3 asd：0 ------------------

mibusys
お礼率99% (156/157)

Linux系OS
回答数3
ありがとう数3

みんなの回答 （3）
専門家の回答

質問者が選んだベストアンサー

ベストアンサー

OKwebb
ベストアンサー率44% (92/208)

2009/02/25 21:26 回答No.2

回答としては#1の方法がベストだと思います。参考までにシェルが希望通りに動作しないのは、パイプ以降がサブシェルで動作するからです。多分asdの行数が1行のときもうまくいかないのではないでしょうか？解決方法としては以下のいずれかが考えられます。 1.変数をexportしてしまう。 2.シェルをbashに変更してwhileの部分も変更する。 while read LINE_STR do 省略 done < uniqData.txt 3.シェルをkshとかに変更。

質問者