• 締切済み

検索サイトの仕組みについて

入社1年目のSEです。 研修期間でJAVAを勉強していて 現在は、JSPをつかって仮想で検索サイトを作ろうと 思っています! しかし、実際のところ検索サイトの仕組みについてよくわかって いません!ので、検索サイトの仕組みについて教えてください! 自分が認識しているのは、キーワードを入力したらそのキーワード を含んでいるサイトがでてくるということだけはわかるのですが… それがどのように出力されるのかがわかりません!! お願いします。

みんなの回答

回答No.1

一般的によく勘違いされているのは 「キーワードを入力して検索ボタンを押した時に世界中のサイトにアクセスしてページを検索している」のではないということです。 Google等のロボット型のサーチエンジンでは24時間絶えず世界中のページのデータを収集しています。収集したデータは自前のデータベースの中に蓄積していきます。世の中のページの情報は常に更新されているので一旦データを収集したサイトのデータでも数日~数週間の周期でひたすら収集しなおしています。サーチエンジンの検索結果が若干古い場合があったり、最新情報が検索されない場合があるのはこのためです。 あなたがキーワードを入力して検索ボタンを押した時、自前のデータベースの中から該当するサイトのページ情報を表示する仕組みになってます。表示順は重要度が高いと思われるページを内部的に判断して画面表示するようにプログラムされています。 なので 1)世界中のサイトのデータを自動的に収集するプログラムがまず必要。 2)収集したデータをデータベースに登録するプログラムが必要。 3)キーワード検索したらデータベースから表示順を考慮しつつ抽出するプログラムが必要。 4)実際にHTMLを構成して画面表示するプログラムが必要。 ボクが作成するなら1)~3)はJava等で作成し4)をJSPに任せます。

関連するQ&A