- ベストアンサー
イントラネットでファイル内キーワード検索
次のような命題が与えられています。 環境:企業内イントラネット エクセル、Power Point等のファイルがアップロードされている。 ★命題★ 「ABC012345」というキーワードがファイル内に含まれるファイルはコレとコレ・・のようにリストする。 膨大なファイル(のリンクがHTMLで書かれている) があるので、キーワードについて、どの文書に書かれているかを 検索したい。 ということなのです。 この命題を実現するには、どうしたらよいでしょうか。 よろしくお願い申し上げます。
- みんなの回答 (4)
- 専門家の回答
質問者が選んだベストアンサー
有償のソフトウェアですが、 Accela BizSearchというのがあります。 テキストファイルやHTMLファイルだけでなく、文書ファイル(Word、一太郎、OASYS、PDF等)やRDB、グループウェア、CADファイル等に対応してます。 NAMAZUは辞書にない言葉は検索できませんが、 Accela BizSearch はNグラム方式で新しい言葉や社内用語にも対応できます。
その他の回答 (3)
- TA-HT81S
- ベストアンサー率39% (72/184)
1.です。 Namazuは全文検索のツールです。 夜間などにバッチで、対象となるファイルの中身を全て解析し、インデックスファイルを生成させます。(mknmz) インデックスの表示にはWeb画面が必要になりますので、Apacheなどを入れておきます。(namazu.cgi) 2回目以降のインデックスの生成は差分だけですので短時間で済みます。
- taketan_mydns_jp
- ベストアンサー率58% (450/773)
> アップロードされている アップロードされていると言う事はサーバですね。 最近ではGoogleさんがかなり便利なので、自サイトであってもGoogle検索を使うなんて方法がありますが、閉じたサイトでは簡単ではないでしょうが、こんな商品も有るようです。 http://www.google.co.jp/enterprise/ 昔からよくやられている方法は、Namazuです(ナマズを飼う、というような言葉が有りますね)。 http://www.namazu.org/ Perl スクリプトなので、ほとんどの環境で動かす事が出来ると思います。サーバがお休みしているような時間帯(通常夜中)にインデックスを作成するので検索はかなり速いです。CGIとして動くので、WEBサーバから検索が出来て、更にダウンロード(共有)も出来ます。 参考まで。
- TA-HT81S
- ベストアンサー率39% (72/184)
全文検索ですね。 Namazuを使いましょう。 その際、xdoc2txtなどのNamazu用PowerPointフィルターも必要になります。 がんばってください。
補足
Namazuはファイル内全文検索ができるのでしょうか?