- 締切済み
MacターミナルでPDFファイル内のキーワード検索
Macのターミナルを利用して、あるPDFファイル内に指定したキーワードが何回登場するかを調べるコマンドや方法はあるのでしょうか? PDFファイルが多数あるため、スクリプトで自動化できると助かると思って「ターミナル」について聞いていますが、それ以外でも簡易な方法をご存知でしたらご教授ください。 よろしくお願いいたします。
- みんなの回答 (2)
- 専門家の回答
みんなの回答
- ki073
- ベストアンサー率77% (491/634)
1つのファイルにどの程度キーワードがあるかにもよりますが、 手軽にできる方法としては、ファイルを特定のフォルダに集めてFinderでキーワードを検索して、キーワードを含むPDFファイルだけに絞ります。それをプレビューで開いてキーワードで検索するとページごとに出現頻度が表示されます。 また、AutomatorにPDFからテキストに変換する機能があります。それにshellスクリプトかRubyなどを組み合わせると、ファイルをドロップするだけで、頻度を表示できるようになります。こちらの方は少し複雑になるので興味がありましたら書き込んでください。 複数のキーワードを検索したいのか、日本語のファイルかなどでもやり方が変わってきます。
- ballville
- ベストアンサー率47% (233/487)
>Macのターミナルを利用して ということなので、まずは正攻法から。 (1) UNIX/Linuxの情報をググれば https://www.google.co.jp/search?&q=PDF+キーワード+検索+linux&oq=PDF+キーワード+検索+linux で、やり方としては、xpdf付属のpdftotextでどこか適当なフォルダにpdfをテキスト化したものを配置して、grepすればいい。どうやら、Macのデフォルト環境ではxpdfはインストールされていなさそうなので、www.google.co.jp/search?q=mac+pdftotext+install でさらに検索 (2)Windowsではpdfのままテキスト検索できるフリーソフトがたくさんあるので、Wineで動かすことを考える http://search.vector.co.jp/vsearch/vsearch.php?key=pdf+%8C%9F%8D%F5&kanji=shift-jis (3)ズルすることを考える pdfを全部GoogleDriveにアップロードし、GoogleDriveに検索させる。