- ベストアンサー
たまった「pdfファイル」の中から検索する方法
何人かでネットワークで共有しているPCがあります。 そのPCの中には、いろいろなデータやキーワードを含むpdf文章(pdfファイル) が入っています。 フォルダはきってあるものの、年々、蓄積される文章が多くなり探し出す のがとても大変になってきました。 そこで、検索バーに検索文字を入れるとPC内を検索して表示してくれる ものを作成したいのですが、どうしたらいいのかよくわかりません。 ちょうど、検索Googleのイメージです。(そんなたいそう素晴らしいもので なくともよいのです) 1つのWEBとしての検索システムを作り上げるために検索バーの出し方と検索機能 の実現の方法を教えて下さい。 自分のPC内だけなら「pdfTrans」等のソフトがあるのでいいと思うのですが これがデータベースとなると手も足もでません。 どなたかサンプル交えて教えて下さい。 お願いします。
- みんなの回答 (6)
- 専門家の回答
質問者が選んだベストアンサー
何人かで共有するという事ですのでnamazuが良いかと思います。 namazuは日本語全文検索システムで、動かすにはちょっと手順(IISやPerlなど)が大変ですが、共有PC(サーバー)上にセットアップしてしまえば、各自のPCのブラウザのみで使用できます。 ちょうどGoogleでインターネットを検索しているのに似ています。 セットアップ方法について参考になりそうなURLを載せておきますね。
その他の回答 (5)
- PCFREAK
- ベストアンサー率51% (417/805)
>ただ、共有PCからの参照の方法が問題なのです。 >共有PCからは、htmlファイル(いうなればHP)から検索窓を出して >入力した検索キーを実行する「namazu」をどう走らせるかです。 namazuで出来ますけど? まさにnamazuはサーバー上のHTMLから実行されるPerlモジュールですので、ご希望通りに動作すると思われるのですが? 検索結果には検索キーで入力した文言にマッチするPDF文書の内容(の一部)が表示され、そのPDFへのハイパーリンクも自動的に付けられますので、ブラウザPDFをダウンロードor直接参照する事が出来ます。 namazuの実行イメージは下記URLです。参考にして下さい。
- 参考URL:
- http://search.namazu.org/
補足
PCFREAKさん、情報ありがとうございます。。 でも、windowsのインストールに失敗しています。 かかしもインストールする必要があるのでしょうか。。 インストールの順序は関係あるのでしょうか。
- chukenkenkou
- ベストアンサー率43% (833/1926)
特定ドライブやフォルダ下のPDF文書の全文検索なら、 Adobe Reader 6.0以降でサポートされていますが? 表題の「PDFファイル」だけでなく、いろいろなファイル に対応したいのでしょうか? データベースと言っているのは、Excelレベルの話ですか? それとも、MySQLやPostgreSQL、あるいはOracle、SQL Serverなどの本物のデータベースのことですか?
補足
質問の件について下記の通りです。 >いろいろなファイルに対応したいのでしょうか? → PDFファイルのみです。 >データベースと言っているのは、Excelレベルの話ですか? → 共有PCでxxxについて、yyyについてというのを掲載している HP(htmlで記述してあって単に共有PCのPDFファイルをリンク(<a href="\....\xxx.pdf") して他のPCから見れるようにしているだけです。やりたいことはその共有の HP上(html記述)で入力した検索文字をキーとして検索するアプリケーション を走らせたいのです。 MySQL、PostgreSQL、Oracle、SQL Server といった本格的なデータベース ではないです。 chukenkenkou さん、どうかアドバイスお願い致します。
- rabbit_cat
- ベストアンサー率40% (829/2062)
最近は、namazuに加えて、 hyper estraier というシステムも人気があるようです。 xdoc2txtを使ってpdfを読みます。 http://hyperestraier.sourceforge.net/ http://www31.ocn.ne.jp/~h_ishida/xdoc2txt.html
- oyaoya65
- ベストアンサー率48% (846/1728)
私はインストールして使ったことはありませんが「namazu(ママズ)」という全文検索エンジンを使えばできるかと思います。 PDFドキュメントの全文検索ができます。 フリーソフトです。 http://www.namazu.org/ http://www10.plala.or.jp/miyazawa/namazu/ http://homepage2.nifty.com/treknz/namazu.html 使ってみてください。
- kiriku
- ベストアンサー率41% (195/468)
Windowsデスクトップ検索やGoogleデスクトップを使えば、PDFの全文検索ができます。
補足
PCFREAKさん、どうもありがとうございます。 「namazu」の日本語全文検索システムは使えそうかなという感触です。 ただ、共有PCからの参照の方法が問題なのです。 共有PCからは、htmlファイル(いうなればHP)から検索窓を出して 入力した検索キーを実行する「namazu」をどう走らせるかです。 どうか、アドバイスお願いします。