- ベストアンサー
過去ログ
ヤフーとかの検索エンジンで検索すると出てくる、2chの1000まで行ったスレッドが、数ヶ月も過去ログに行かないのは何故ですか? あれは手動でやってる?から、忘れてるんでしょうか?
- みんなの回答 (2)
- 専門家の回答
質問者が選んだベストアンサー
キャッシュというのは、ローカルHDDあるいは近くのサーバにWebページのデータをコピーしておき、同じURLが出てきたらそちらを参照して素早くアクセスできる、という目的のために用意されています。 自分のPCで言ったら、「Temporaly Internet Files」の中のファイルが、キャッシュです。 Google等では、自社でキャッシュサーバを設置してあり、目的サイトを一時的にコピーしてあるものが、キャッシュです。 >キャッシュというのは、検索したスレッドをクリックすると、1001であっても999レス目の状態と全く同じスレッド形態で見れるものも含む、という事であっていますかね? 近いですが、微妙に違います。 『最後に正常にアクセスできた状態』の、コピーとなります。 例えば、レスが900まであったスレッドを一度読み、キャッシュに保存されていたとします。 その後レスが一気に1000にまで伸び、しばらくは1001まで読める状態ですが、その間にクローラのアクセスが無く、DAT落ちしてしまったとしましょうか。 そうするともう、キャッシュにはもう900までのレスしか残っていません。 901~1000のレスは、●を買うなりして直接2chのシステムに見に行かなければ、読めないわけです。 クローラは、更新の速いページでは、より頻繁にページ内容をチェックし、検索インデックスを構築、キャッシュを更新しています。 でもその様に、突然伸びてDAT落ちしてしまったスレッドなどでは、読み落としも当然に発生し、キャッシュで最後まで読めるという保証はありません。 あくまでも、検索サーバがそのページを最後に見たときに、どういうデータであったか。 それがキャッシュに残ることになります。
その他の回答 (1)
- asciiz
- ベストアンサー率70% (6809/9681)
過去ログに行くのは、*.2ch.net のサーバー上で、ディスク領域節約等のため、過去ログサーバに退避、消去、としているからです。 YahooやGoogleなどの検索エンジンは、単純にそのWebページのキャッシュとして、独自の規定期間、保持しています。 検索エンジンが再度クロール(ページデータの確認)に行ったとき、正常にアクセスできれば、キャッシュデータも更新されますが、エラーとなった場合には、キャッシュはそのままにしておきます。 「エラー」即「ページが存在しない」ではなく、サーバーが混んでたり落ちていたりして、一時的に見られない状態の時もあるからです。 そういう動作が、お互いにどう関係するかというと。 (1)2chでスレッドが発生し、伸びる (2)検索エンジンのクローラが訪問し、ページをキャッシュする (3)レスが伸び、1000まで埋まる (4)さらにたまたま検索エンジンのクローラが訪問し、更新されたページをキャッシュする (5)翌日等に、DAT落ちする (6)クローラが訪問するが、アクセスエラー。キャッシュはそのまま保持される その結果、本家2chではとっくにDAT落ちしてるけども、検索エンジンのキャッシュには残っている、という状況が発生するわけです。 検索エンジンのキャッシュがいつ破棄されるのは公開されていません。 個人情報的にまずい物などは、申請して消去してもらうことが可能ですが。 2chのスレッドに対しては、そんな申請をする人もなく、検索エンジン会社のディスクの都合で、すぐ消えたりあるいはいつまでも残ってたり、するのでしょうね…。
お礼
ありがとうございます。 キャッシュというのは、検索したスレッドをクリックすると、1001であっても999レス目の状態と全く同じスレッド形態で見れるものも含む、という事であっていますかね? ネットシステムにまだまだ疎いので、すいません。
お礼
再度お答え頂きまして、ありがとうございます。 なるほど、キャッシュの仕組みが分かりました。 なかなかネットは複雑ですね。