- ベストアンサー
VBからPDFファイルの埋め込みテキストを検索する方法
VBで文書を検索できるシステムを作っています。 通常検索では、テキストボックスに入力した文字列と一致するものをデータベースに登録した文書名から探してきてMSHFlexGridコントロール上に表示するようにしています。 今回は、追加検索として、指定したフォルダの中にあるPDFファイルやワードファイルなどの文書中の文字から一致するものを探して表示する機能を作りたいと考えています。 この様な機能はどの様に作れば良いのでしょうか? 色々とサイトを探してみたのですが、該当するものを見つけることが出来ませんでした。 よろしくお願いします。
- みんなの回答 (2)
- 専門家の回答
質問者が選んだベストアンサー
こんにちは。 [xdoc2txt] PDF,WORD,EXCEL,一太郎などの各種バイナリ文書からテキストを抽出 http://www31.ocn.ne.jp/~h_ishida/xdoc2txt.html VB から xdoc2txt.exe を起動して抽出テキストをリダイレクトする。 または、ActiveX 版 xdoc2txt.ocx を使うとか。 一から VB でとなると恐ろしく面倒で、難しいですよ。 まず速度面の問題があるでしょうし、ファイルフォーマットの解析が 必要になったり。。
その他の回答 (1)
- temtecomai2
- ベストアンサー率61% (656/1071)
明示的に使ったことはありませんが、Microsoft の各種検索エンジンに検索対象を増やす目的で iFilter という仕組みがあります。 これも調査なさってはどうでしょうか。 <Microsoft のサイトに掲載されている iFilter の一覧> http://www.microsoft.com/japan/sharepoint/server/downloads/IFilter.mspx <iFilter を利用して PDF のテキスト検索をするサンプル> http://gihyo.jp/dev/serial/01/make-findspot/0016