• ベストアンサー

リンク先のHPを全文検索したいのですが

自分のホームページにリンクしているホームページのみを全文検索したいのですが、方法はあるでしょうか。 numazuだとサーバー内だけと聞いていますし、一般の検索エンジンを使うとリンクしていないホームページまで検索してしまうので、目的に合いません。 本格的なデータベースを構築すると費用がかかるので、簡易なデータベースあるいはフリーのソフトで行う方法があれば教えて下さい。 検索したいリンク先の件数は、約1000件を予定しています。

質問者が選んだベストアンサー

  • ベストアンサー
  • kokucho81
  • ベストアンサー率61% (157/255)
回答No.2

『httpdown』 と 『全文検索』 を組み合わせることで可能ではありますが、多分、1000件という数字は現実的ではないですね。 少なくとも、あらかじめ、検索インデックスを作成していない状態で1000サイトものサーバ外サイトを検索したら、検索ボタンを押したら制御は当面かえってこず、検索エンジンとして成立しないでしょう。 やはりnamazuなどインデックス生成型全文検索システムを改造して、「その1000件のサイト」を対象とする「WWW収集型ロボット」を作るしかないと思います。

kawasaku
質問者

お礼

ご回答ありがとうございます。 やはりCGIプログラムを組まなければ難しいのでしょうか。 検討させていただきます。

その他の回答 (1)

  • a-kuma
  • ベストアンサー率50% (1122/2211)
回答No.1

自分でソフトを組む方法ではなく、一般の検索サイトの話です。 Google の「検索オプション」では、URLに関連しているページに 絞って検索をすることができます。

参考URL:
http://www.google.com/intl/ja/
kawasaku
質問者

お礼

ありがとうございます。 早速試してみます。

関連するQ&A