• ベストアンサー

Apacheのログについて

はじめまして、こんにちは。私は会社でApacehの運用管理をしているのですが、Apacheのログについて教えてください。 100Mほどのファイルが10個あって、それらの月別のダウンロード数をカウントしているのですが、たとえば「"GET /aaa/A.pdf」の数をカウントしています。 でもよくログを見てみると、同じIPアドレスから同じファイルに10秒後にアクセスしていたり、たまに約10秒ごとに4回アクセスしている形跡が残っています。例えば以下のような感じです。 [27/Mar/2006:16:47:37 +0900] "GET /aaa/A.pdf[27/Mar/2006:16:48:48 +0900] "GET /aaa/A.pdf[27/Mar/2006:16:48:54 +0900] "GET /aaa/A.pdf [27/Mar/2006:16:49:25 +0900] "GET /aaa/A.pdf これってダウンロードするのに時間がかかっていて、1つのファイルしかダウンロードしていないのに、2回カウントしたり、4回カウントしているのでしょうか? 4回続けて、10秒ごとに同じファイルをダウンロードしたりするのは不自然だと思うのですが・・・ よろしくお願いします。

質問者が選んだベストアンサー

  • ベストアンサー
  • MrBan
  • ベストアンサー率53% (331/615)
回答No.2

私も不自然だとは思いません。 「あ、でかい」と一度躊躇してキャンセルしてから、(他にいいものがないので諦めて)後で見に行く、とかありそうです。 PDFのようなものは別のページに跳んでから「戻る」で帰ってきたり、 複数サイトを閲覧していて切り替えた際に再要求されたりすることもありえそうです。 また、サーバの応答が悪いと、既にダウンロードが開始されていることにユーザが気づかず、連続してクリックされることもあるでしょう。 ブラウザがタブブラウザ(ログでは多分IE扱い)だったりすると、ユーザが気づかずにそういう動作になってる可能性もありそうです。 # 応答がないと10秒待って再要求する仕様だったり。 ちなみに、カウントされている数だけファイル自体はダウンロードされてるとは思いますが、それが保存されている保証はないので統計上注意したほうがよろしいかと。 IEでPDFを開けばブラウザのテンポラリに展開されるますが(これもログではダウンロードに見えるでしょう)、ユーザは保存したつもりなどないですし、当然ファイルも勝手に消えます。

その他の回答 (1)

回答No.1

サーバの動作が遅いときに、リンククリック・中断・リンククリック と何度も操作することはしょっちゅうありますね。 >不自然だと思うのですが・・・ まったく思いません。