- 締切済み
LaTeX で 単語数を数える方法
LaTeX で 単語数(英文)を数えるにはどうすれば良いでしょうか? Linux上で使っていますが、wc コマンドでは、LaTeXの制御文字までカウントしてしまいます・・・ 何か方法がないでしょうか?
- みんなの回答 (2)
- 専門家の回答
みんなの回答
- komugi100g
- ベストアンサー率58% (108/186)
\alpha のような文字になるコマンドもあれば \bf のような文字にならないコマンドもあるし \setlength{#1} みたいな引数の中が文中に出てこないものもあれば \section{#1} みたいな引数の中が文中に出てくるものもあるし explanクラスみたいなitemやtable環境の 指定方法を変えちゃってるものもあって コマンドの書式に一般性がないから detexではそういう処理になってるんじゃないかな。 なんとか.sed というファイルに s/%[^\n]*$//g s/\\begin{[^}]*\}//g s/\\end{[^}]*\}//g s/\\part\[\([^\]*]\)\]/$1/g s/\\chapter\[\([^\]*]\)\]/$1/g s/\\section\[\([^\]*]\)\]/$1/g s/\\subsection\[\([^\]*]\)\]/$1/g s/\\subsubsection\[\([^\]*]\)\]/$1/g s/\\[a-zA-Z@]*//g s/\\[a-zA-Z@]*//g s/[{}]//g のように書いて $ sed -f なんとか.sed < なんとか.tex とすればもう少しまともな結果で出てくると思うけど…。 確実なのはdviファイルからdvi2ttyで抜き出すか psに変換してpstotextで抜き出すか pdfに変換してxpdfのpdftotextで抜き出すかかな。 それぞれの変換方法では表の罫線の出力とかが若干変わると思います。
- jyunna
- ベストアンサー率66% (4/6)
detexでTeXコマンドを取り除いてから,wc -wをかけてはいかがでしょう. detexでうまくいかなければ,dvi2ttyやuntexを探してみてくださいな.
補足
detex は試したのですが、たとえば、 \begin{itemize} \item ABCDE \end{itemize} これが、 beginitemize item ABCDE enditemize となってしまいます。 つまり、本来 ABCDE の1単語だけなのに、4単語になってしまいます。 jyunnaさんはどのように使っているのですか?