- ベストアンサー
ネット上で検索した時、見つかる場合とそうでない場合があるのは?
ネット上で検索した時、見つかる場合とそうでない場合があるのはなぜですか? 例えば、この下に・・・ んじえひ なんて、他の方が書かないような文を書いてみます。 これを、Google とかで、検索かけても 見つからないと思います。 でも、ある掲示板での書き込みではヒットすることが あります。 ヒットする条件と、ヒットしない条件とはなんなのですか? また、どのようなしくみで、検索というものは行われているのでしょうか? 皆様よろしくお願いします。 1996年頃からの疑問でした。 ひょっこり 思いだして書き込みしております。 よろしくお願いします。
- みんなの回答 (2)
- 専門家の回答
質問者が選んだベストアンサー
Googleでは検索インデックス作りのために、日夜、何百というサーバーが無数にあるWebページをクロールしています。 しかし、それだけで検索キーワードを作ることはできません。 ・日本語の場合には文から単語を抜き出すことが難しい。(英語のように単語間にスペースがあるわけではない) ・2byte文字のため、検索キーワードが膨大になりやすい。 では、どうやって検索キーワードを絞りこむかですが、それこそ、各社検索システムのノウハウの塊りなのです。 例えば、辞書を用意しておいて、辞書にない単語はインデックスに使えないようにするとか、 そのWebページにしか出てこないような単語は無視するとか、 そのようなキーワードの絞込みを上手にすることで、限りあるサーバー容量で、すばやく結果を表示させるのが、検索システムの腕の見せ所というところですね。
その他の回答 (1)
- hyde19
- ベストアンサー率29% (196/661)
ネットワーク上に何でもある訳じゃありません。だから「んじえひ」という検索をやってみたんじゃないですか? この時点で半分以上答えがでている気がします。 検索というのは、民間の検索会社のホームページを使って行っています。もしくは、個人の設置したプログラムを使っています。 検索をする度に、世の中にある全てのHPを調べている訳ではありません。(限定された中では可能です) 検索エンジンというのは、検索する情報を集めるプログラム(クロウラー)、集めた情報を整理してデータベース化するプログラム、そのデータベースを検索するプログラムに別れています。 あなたが使っているのはその最後の検索プログラムなのです。 クロウラーが適時世界中のHPを巡って情報を集めますが、全ての情報をデータベース化する訳ではありません。データとしてのストックはしますが、データベースに整理する段階でキーワードを抜き出しています。私たちはこのキーワードを検索していますので、高速な検索ができるのです。
補足
トレンドマイクロさんのおかげで質問・回答、どころではなかったですね。 その中でのhyde19様よりのコメントありがとうございます。 さて、 >だから「んじえひ」という検索をやってみたんじゃないですか? はい、試しにやりました。 もちろんヒットしませんね。 理解したことは、 検索は、まず、クロウラープログラムによりHPを巡回、情報収集。 それを、データベース化する別のプログラムの存在。 最後に、データベースから、検索を行うプログラム 3つあるということですね。 ここで、また疑問が・・・ Q1. クロウラーは、全ての情報を集めるが、次の段階のデータベース化プログラムで、集められた全ての情報を、データベース化しているわけではないとしてあります。 膨大な世界のネット上の情報全てを、データベース化するのは当然無理とは理解できます。 では、データベース化する(キーワードを抜き出し)条件としない条件の境とは、どのようなことなのでしょうか? 大手のHPなのか、よく読まれているHPなのか、そのようなことが、優先順位として 抜き出されているのでしょうか?
お礼
なるほど、 日本語は、特に難しいのですね。 長い間、のどにつかえていたものがとれたような感じです。 ありがとうございました。