• 締切済み

PDFファイルに表示されているテキスト検索は可能ですか?

ホームページを作成する際に、ページのリンクボタンからPDFファイルにリンクさせ、そのPDFファイルのテキストのキーワードを検索できるようにしたいと考えています。 AcrobatのPDFファイルに表示されているテキストを検索することはできるのかどうか教えてください。 1.ブラウザ上でできるのか。 2.ブラウザ上に表示させているPDFファイルのテキストのキーワードを検索しようとした場合、ASPやJavaScript等プログラムを作成すれば検索は可能となるのか。 質問が下手ですみませんが、ヒントでもいいので是非教えてください。宜しくお願いします。

みんなの回答

  • yaya999
  • ベストアンサー率50% (4/8)
回答No.5

ん??namazuではだめですか?Perl版ならCGI設置が可能ならば、気軽に利用できると思うのですが・・・

参考URL:
http://www.namazu.org/
  • magudon
  • ベストアンサー率57% (4/7)
回答No.4

>どういう機能があるのか試せるといいなと思ってしまいま>した。 以下のサイトで実行できる評価版が ダウンロードできるようです。 http://www.xelo.co.jp/XELO/download/index.html#Anchor-53359

  • magudon
  • ベストアンサー率57% (4/7)
回答No.3

できるようです。 自分で動かして確かめたわけではないですが、 以下のようなソフトがあります。 http://www.vector.co.jp/soft/win95/writing/se132808.html あと、ナレッジベースとかテキストマイニングとか のキーワードがついているソフトの機能をお調べに なるとよいと思います。

参考URL:
http://www.vector.co.jp/soft/win95/writing/se132808.html
english
質問者

お礼

ありがとうございます。 教えていただいたソフトは購入前に試すことができないみたいですが、どういう機能があるのか試せるといいなと思ってしまいました。 その他のソフトも含めて調べてみます。

noname#25358
noname#25358
回答No.2

 補足見ました。  今この場で言えるのは、アドビ社の胸ひとつである、ということです(笑)

noname#25358
noname#25358
回答No.1

 理論上は可能ですが、ものすごく難しいです(^_^;  PDF形式のファイルをテキストエディタなどで開いてみると分かると思いますが、実データがフィルタか何かでエンコードされてしまっています。  よって、この文字列をデコードして検索をかけるという処理が必要です。  まずJavaScriptでは仕様上不可能です。ASPなら、PDF形式をデコードする資料があれば可能ですが、フルコーディングするとおそらくプログラムがめちゃくちゃ重くなって使えないことも考えられます。  それにその資料とやらも、アドビ社にPDF形式のデコードロジックの著作権を主張された場合、強行すると違法です。  よって、アドビ社に問い合わせてみて断られたら、あきらめるしかありません。

english
質問者

お礼

ありがとうございます。 JavascriptにしてもASPにしても、ほぼ無理ということですね。他に可能性があってかつ現実的な方法はないのでしょうか。それともPDFファイルの検索自体をあきらめざるを得ないのでしょうか。

関連するQ&A