• 締切済み

LaTeX で 単語数を数える方法

LaTeX で 単語数(英文)を数えるにはどうすれば良いでしょうか? Linux上で使っていますが、wc コマンドでは、LaTeXの制御文字までカウントしてしまいます・・・ 何か方法がないでしょうか?

みんなの回答

回答No.2

\alpha のような文字になるコマンドもあれば \bf のような文字にならないコマンドもあるし \setlength{#1} みたいな引数の中が文中に出てこないものもあれば \section{#1} みたいな引数の中が文中に出てくるものもあるし explanクラスみたいなitemやtable環境の 指定方法を変えちゃってるものもあって コマンドの書式に一般性がないから detexではそういう処理になってるんじゃないかな。 なんとか.sed というファイルに  s/%[^\n]*$//g  s/\\begin{[^}]*\}//g  s/\\end{[^}]*\}//g  s/\\part\[\([^\]*]\)\]/$1/g  s/\\chapter\[\([^\]*]\)\]/$1/g  s/\\section\[\([^\]*]\)\]/$1/g  s/\\subsection\[\([^\]*]\)\]/$1/g  s/\\subsubsection\[\([^\]*]\)\]/$1/g  s/\\[a-zA-Z@]*//g  s/\\[a-zA-Z@]*//g  s/[{}]//g のように書いて  $ sed -f なんとか.sed < なんとか.tex とすればもう少しまともな結果で出てくると思うけど…。 確実なのはdviファイルからdvi2ttyで抜き出すか psに変換してpstotextで抜き出すか pdfに変換してxpdfのpdftotextで抜き出すかかな。 それぞれの変換方法では表の罫線の出力とかが若干変わると思います。

  • jyunna
  • ベストアンサー率66% (4/6)
回答No.1

detexでTeXコマンドを取り除いてから,wc -wをかけてはいかがでしょう. detexでうまくいかなければ,dvi2ttyやuntexを探してみてくださいな.

参考URL:
http://www2.odn.ne.jp/107steps/plamo.html#detex
white-tiger
質問者

補足

detex は試したのですが、たとえば、 \begin{itemize} \item ABCDE \end{itemize} これが、 beginitemize item ABCDE enditemize となってしまいます。 つまり、本来 ABCDE の1単語だけなのに、4単語になってしまいます。 jyunnaさんはどのように使っているのですか?

関連するQ&A