• ベストアンサー
※ ChatGPTを利用し、要約された質問です(原文:Webで取得できる情報)

Webで取得できる情報

このQ&Aのポイント
  • Web上での情報取得について質問があります。
  • 具体的には、自分のサイトにアクセスされた際にリンク元のタイトルやキーワードを取得する方法、また別のサーバーに置かれたファイルのサイズ情報を取得する方法について知りたいです。
  • どのような方法やツールが利用できるか、教えていただけると幸いです。

質問者が選んだベストアンサー

  • ベストアンサー
  • steel_gray
  • ベストアンサー率66% (1052/1578)
回答No.1

Q1~Q3まで。絶対ではありませんが可能です。 前提としてリンク元については Referer(リファラ)という情報しか得られません。 これは前のページでブラウザのURL欄に表示されている内容で、例えば perlでは環境変数の$ENV{'HTTP_REFERER'}、Javascriptではdocument.referrer で参照できます。 ただし、内容については空白であったり利用者が詐称することも可能なので100%あてにできるわけではありません。(proxy経由だとさらにややこしいかも。あまり知りませんが。) で、Refererが得られれば実際に元のページにアクセスする事でタイトルを得たり、ページのサイズを得ることもできます。 また、検索キーワードについては元のURLにキーワードが含まれているケースが多いです。 例えば gooで「面白い」を検索すると http://search.goo.ne.jp/web.jsp?…&MT=%CC%CC%C7%F2%A4%A4&… googleで「面白い」を検索すると http://www.google.com/search?…&q=%E9%9D%A2%E7%99%BD%E3%81%84&… このようになります。それぞれMT=とq=の後ろにエンコードされた「面白い」という単語がありますので検索エンジンを特定してキーワードの部分を抽出し、またそれぞれに適したデコードを行う事で検索したキーワードを推察することができます。 ページタイトルやサイズを得るため、リンク元のページにアクセスする方法についてはphpやperl等でそこそこプログミング経験があれば可能です。 phpは未経験ですがそのための関数が在ったと記憶しています。 perlでは http://oshiete1.goo.ne.jp/kotaeru.php3?q=1758795 こちらの質問が参考になるでしょう。 主な検索エンジンからの検索キーワードの抽出の仕方についてはアクセス解析の(無料)CGIが参考になるかと思います。

すると、全ての回答が全文表示されます。

関連するQ&A