• ベストアンサー

画像検索プログラム

プラットフォームはLinuxです。perl,php,tex等を少し知っている程度の経験です。 下記の材料を元に、仏典内容検索:閲覧システムを作成しようと考えています。 材料1 古い仏典をスキャンし、jpegデータにて保存(全部で300ページ分)。 材料2 上記の画像データとは別に、すべてのページ分のtxtデータを作成。 例えば「念仏」という単語を検索窓に入れると、材料2にある「念仏」の文字列 が抽出され、それに対応する画像データがPDF形式にて表示されるようなシステムです。 そこで次のような質問があります。 質問1 どのようにして検索を実行させるか 質問1 検索結果の文字データと画像をどのようにリンクさせるのか 質問2 どのようにして対象画像データをPDF形式に変換させればよいか 検索は単純にNAMAZUかなと考えています。 画像とtxtデータのリンクは正直よくわかりません。 PDF作成は、PDFlibというものが評判もよく、使えるのではないかと判断しております。 経験者のみなさまならどのような方法でこのような検索システムを作成しますか? さまざまなご意見、お待ちしております。

質問者が選んだベストアンサー

  • ベストアンサー
  • kirin_f
  • ベストアンサー率51% (44/85)
回答No.2

仏典内容検索:閲覧システムはWebサーバー上で実行&ブラウザから使用ということでしょうか? 私ならですが、 txtデータではなくHTMLにして、あらかじめPDFにしておいた画像にリンクをはり、HTMLファイルを対象にNAMAZUで検索させるというようにすると思います。 300ページものPDF・HTMLを手で作成するのは大変なので、そこはPDFlibなどを使用して変換用プログラムを作ります。で、実行してできたファイルのみをサーバーにあげます。 細かい仕様によるとは思いますが、書かれている内容を読む限りは、すべてのページを動的にする必要性はないように思います。

zerofore
質問者

お礼

kirin_fさん、お礼が遅くなり申し訳ございません。 はい。kirin_fさんのご認識どおり、Webサーバ上で実行、ブラウザで使用を想定しています。 今回は、何とか動的にPDFを作成したいと考えてはいます。 理由は1 動的に作成してみたい! 2 動的作成のほうが、セキュリティ的に 強いのではないかと考えているため(本当に強いかどうかどうかの確信はありません....)。 ただ、帳簿や申込書等をPDF出力するわけではないので、ご指摘の通り、動的にする必要性はそんなにはないとも考えております。 いずれにせよ、貴重なご意見ありがとうございました。

その他の回答 (1)

回答No.1

PHP + データベースで作成可能です。 データベースのレコードへ画像のファイル情報、検索キー を入力します。 PDFの出力はfpdfを使うといいですよ。

参考URL:
http://fpdf.japansite.net/
zerofore
質問者

お礼

realforceさん、お礼が遅くなってしまいて申し訳ございません。参考になるご意見ありがとうございます。 わがままを言うのは場違いかとも思いますが、もし出来れば、「データベースのレコードへ画像のファイル情報、検索キーを入力」という所、もう少し具体的に説明していただけたらとは思うのですが....。よろしくお願いいたします! fpdfの情報も大変参考になりました。PDFlibとの機能の違い等を調べていくつもりです。PDFデータの改ざん防止、プリントアウト防止、出来ればダウンロード防止機能をつけられればと考えていますので。

関連するQ&A