• 締切済み

【Perlでaccess.logの解析をしたいです】

自分のホームページに訪れる人は、 どんな検索ワードなのか知りたくて、 access.logの解析スクリプトをperlで作成しようと思っています。 そこで何点かご教授いただきたい事があります。 1.apacheのログフォーマット   標準の状態では私の行いたいことができないと思うのですが、   以下の指定で行えるようになるでしょうか?     LogFormat "%h %l %u %t \"%r\" %>s %b \"%{Referer}i\" \"%{User-Agent}i\"" combined 2.文字列の分割   例えばGoogleの場合、「q=」以降が検索ワードだと思いますので、   そこから単語を分割したいのですが良い方法がわかりません。   以下のように単語の区切りに全角と半角のスペースが混在している場合、   スマートに処理するにはどうしたらよいのでしょうか?      よろしくお願いいたします。

みんなの回答

  • guci-ok
  • ベストアンサー率33% (49/146)
回答No.1

質問のご様子では、この方面に関して余りお詳しくないようですね。 自分で作成するのも結構ですが、既に先達によって多くの解析ソフトが作成されていますから、それらを参考にされてからにしてはどうでしょう。 私は、AWSTATを薦めます。 Perlで書かれていますから、これを改造するほうが近道です。自分だけで使うなら何の問題もないでしょう。

mac_mini
質問者

お礼

ご回答ありがとうございます。 AWSTAの存在は知っていましたが、 そこまで高機能なものですとperlの知識がないため、 何処を参考にして良いかわかりませんでした。 (正規表現が難しいです) ちなみに1の件に付いては、解決しました。 apacheのログでgoogleの「p=」というキーワードが出力されたので、 半角&全角スペースの問題がクリアできれば何とかできそうです。 どうかアドバイスをお願いいたします。

関連するQ&A