- ベストアンサー
ファイルの単語数カウント方法:教えてください!
- 翻訳の仕事でファイルの単語数をカウントする方法を教えてください。
- ファイルには英語のフレーズが300行ほどあり、=以降の単語数をカウントしたいです。
- 手動で不要な部分を削除し、ワードカウントにかける方法を使っていますが、効率的な方法を知りたいです。
- みんなの回答 (3)
- 専門家の回答
質問者が選んだベストアンサー
「正規表現」が使えるテキストエディタを使って下さい。 そうすれば、「="」と「";」に挟まれた文字列の抽出、程度なら比較的簡単にできるはず。 私はMacは使っていないので具体的なソフトはわかりません。 Windowsの例として、秀丸エディタの場合、こういう使い方をします。 http://www.shuiren.org/chuden/teach/hidemaru/seiki/index-j.html もし文字列の終わりが「";」でなく「"」だった場合、一番最後の 「注意事項―最長一致の原則―」 という欄のお話が参考になるでしょう。 抽出さえ済めば、あとは「="」と「";」を空白文字に置換すれば簡単に消せます。
その他の回答 (2)
- Executione
- ベストアンサー率43% (182/418)
少しだけ手作業が省ける方法です。 ※Excelがなかったら、以下、読んでも意味がありません。 (1)まず、全文をExcelにテキストで貼り付けます。(1つのセルに一文が入っています。) そのまま、文章の入っているセルを全て選択します。(例えば、A1~A300行分) [データ]の「区切り位置」をクリックします。ウィザードが起動します。 データのファイル形式を、「●カンマやタブなどの~」を選択して、次へ。 「区切り文字」のチェックを全てはずし、「その他」にチェックします。その横に「=」を入れます。 その下の「連続した区切り文字は~」は、チェックしたままです。次ぎへは押さずに完了をクリック。 そうすると、「=」が消え、=の左と右が分離するので、左を削除しておきます。 (2)残った右のセルをまた、全て選択します。 また、区切り位置のウィザードを起動し、データのファイル形式は同じなので、次へ。 「区切り文字」は、タブからその他まで全てにチャックを入れます。 その他の右に「"」を入れます。 右上にある「文字の引用符」を「"」にして、完了をクリックします。 ※(1)をやるときに(2)のように文字区切りを全てチェックして、一回で終わらせてもいいのですが、=の左の文字列に「;」やスペースなどが入っていると、セルが分割されて、列が乱れてしまうので、2回に分けました。質問文の例題には、「"」しかなく、スペースもないので1回でうまく出来ますが。 (3)ある程度、バラバラになりましたが、まだ、「¥」など不要なものがあります。 ここから、ほとんど手作業です。 しかし、見落としがあると困るので、置換を使います。 面倒なので、A列1行の左上の角にある部分をクリックして、全セルを選択します。 [編集]の「置換をクリック」 検索する文字列に「¥*」と入力します。 置換後の文字列は何も入れず、右にある書式から、「書式」を選び、「色」を赤にしておきます。こうしておくと目立つので、見逃しがないため。 で、置換をしていきます。 「¥」だけが消えますが、「%@」が赤く残るので、削除します。 ピリオド「.」は、残しておいてもいいと思います。 (4)完成したら、単語数を数えます。 Aの1列は全て空白になっていると思いますので、次の式を入れます。 横1行の単語が、B1から入っているとします。1行目は、3つしかないかもしれませんが、2行目は10こあるかもしれません。したがって、一番多い列にあわせますが、多分Z行まではないと思いますので、「z」でいいと思います。 =COUNTA(B1:Z1) これは、空白でないセルを数えています。なので、空白はいくらあってもかまいません。 これをコピーすれば、自動で数えてくれます。 最後に、=sum(A1:A300) のようにすれば合計が計算されます。
- chieffish
- ベストアンサー率44% (1149/2554)
他のソフトは知りませんが、データベースソフトのFilemakerProなら 改行区切りテキストを読み込めば全自動?で出来ます。 \"%@\"とか無視されると思いますが。 いろいろなことに使えますし、仕事データの保存用に持っていた方が。