インターネットの仕組みでは無く、検索会社の検索エンジンの仕組みですね。
検索会社とはGoogleやYahooなどです。会社は独自の検索エンジンを持っており、それらの仕組み自体が会社の独自の特徴であるので仕組みについて詳しい公開はしていません。でも多くは次のような仕組みです。
検索エンジンはインターネットを自動巡回して(ネットサーフィンの自動ロボットのようなもの)サイトの情報を閲覧しテキスト情報と画像情報、動画などの分析をします。
これらの情報はタグと言われる語句、や単語に分解され保存されます。そのときにサイトのURLとそのタグは関連付けて保存します。
つまりインデックスをつけるわけで、このつけ方に特許があります。これらのインデックスはサーバーに保管されるわけですが、グリッドと言われる複数のサーバーで一つの処理をする仕組みで処理されます。
このグリッドの仕組みも特徴があるので秘密ですが、保管場所は世界中に分散されて同期がとられています。
それらを一回の命令で数十台が一度に検索すると思ってよいでしょう。ここで検索されるのはテキスト情報ですので、それほどの容量はいりません。といっても大きいですが。
タグ検索をして関連URLをくっつけて結果を表示します。良くリンク切れとかの結果があることがありますよね。これは収集ロボットの更新が間に合わなかったためです。
つまり実体は検索会社側にありません。検索エンジンが受け持つのはタグ検索とURLだけ。URLの先が既に無くなっていることもあるわけです。それらは別の会社のサイトですから。
その先のサイトはそれぞれの企業。またはレンタルサーバー会社の物であり、物理的には無数存在するわけです。検索エンジンはそれらの地図を作成して提供しているのです。
お礼
難しいことはわからないのですが、世界中に図書館があって、検索エンジンがその図書館から命令された本を探してくるということでしょうか。ありがとうございました。