• 締切済み

サイト内のファイル検索

サイト内のファイルを検索できるcgiを探しています。 ページ内の文字列に対しての検索ではなく、ファイルそのものの検索ができるようにしたいのです。 ページ内にテキストとしてのキーワードがなく、検索対象になるページ数も多いので、どうして良いのか困っています。 例えば「HPの閲覧者からは見えないように、各ページにキーワードをMETAタグのように埋め込んで検索する」もしくは「簡易データベースを作る」という方法になるのでしょうか? もしくはCGIだけでなく、Java Scriptでもできるのでしょうか? ちなみに検索の対象になるファイルは500ページを越えています。 CGI初心者が設置するには難しいのかもしれませんが、どなたかご教授をお願いします。 また、参考になりそうなHPがありましたら、教えていただけないでしょうか? よろしくお願いします。

みんなの回答

  • nta
  • ベストアンサー率78% (1525/1942)
回答No.1

ファイル名に検索目的の検索語(シソーラス)に対応したものをつけることができるのであればPerlの正規表現を用いれば検索は簡単にできます。そういうことが困難であればファイル名とキーワードを対応させるデータベースファイルを作成しなければなりません。データベースはCSVファイルで作成し、Perlで読み込んで検索するようなものであれば簡単に作れます。検索機能のあるBBSのスクリプトを見れば参考になるでしょう。  あり合わせのものとしてはカード型データベースというのもいいかもしれません。ファイル検索が必要なので幾分手直しが必要かと思いますが、Windowsで作成してサーバにアップロードする方式です。 http://www.dicre.com/soft/tcard.htm  最近の流れとしてはページの一部を変更してXMLで記述して、その中にキーワードタグを埋め込み、servletや専用のXMLパーサで読み出すという方式も考えられます。今後データベースがどんどん拡張されることが予想される場合には検討されてもいいでしょう。 http://www.atmarkit.co.jp/fxml/rensai/xmljava01/xmljava01.html

clover_44
質問者

お礼

丁寧なご回答有り難うございます。 データは今以上には増えないのと、XMLとシェアウェアのソフトは使えませんので、csvのファイルを作る方法で進めて行きたいと思います。 実は「Perlの正規表現」というのもわからない初心者でして・・・BBSの検索機能もとても参考になりました。もっとよく調べてみます。 どのようなタイプの検索cgiが必要か教えていただけて、本当に助かりました。 有り難うございました。 お礼が遅くなっていまい、失礼しました。