• 締切済み

迷惑メールの受信に関するデータを作りたい

ヤフーの無料のメールアドレスを使っています。 10ヶ月でちょうど2000件の迷惑メールが届きました。(去年の12月2日から今日まで) そこでこの迷惑メールについてのデータを集めエクセルでいじってみたいと考えています。 やりたい事は、届いた日付(月、日)、曜日、時間のデータをエクセルに取り込み集計してグラフにできるといいなと思っています。 どの曜日にメールが多く届くか、どの時間帯によく受信するかなどなど。 最終的にはグラフにしたいです。 皆さんのアドバイスお待ちしています。

みんなの回答

  • Wendy02
  • ベストアンサー率57% (3570/6232)
回答No.3

matsu_jun様 Wendy02です。こんばんは。 どうも、私をお引き合いくださりありがとうございます。 >私にも根性があればよいのですが、振り分けすらできずに放ってあります。 sinopusu様は、たぶん、迷惑メール対策ツールを使っているように思いました。それでなければ、とてもではないのですが、10ヶ月も取り置きしておけません。 私の迷惑対策方法は、以前から実績を挙げていたのですが、それを人に教えてあげても、むつかしいとか、分らないとか、場合によっては、マニアックだとか人から批判される始末です。回答者のプライドを傷つけたということもかしれませんが、あまりに幼稚なことを言う人もいます。ストーカーめいた嫌がらせに近いものもあり、掲示板では語ることはやめてしまいました。 知り合いには、未だに手取り足取りで教えています。自称パソコンに詳しいという男性でも、アドレスを換えるほかはないなんて言う人がいます。 最近は、スパムでも、非常に悪質なものがありますから、ダウンロードして振り分けとかは、しないほうがよいと思います。中国系のスパムとスパイウェアは強力です。アメリカのスパイウェアと同様に、市販のツールでは掛かりにくくなっているようです。メーラー内の振り分け削除の方法が、未だに主流のようですが、できるなら、やはりツールを使ったほうがよいです。 ウィルスバスターが良いという話も聞きますが、私は分りません。私は、一時期、ほとんどのオンライン・ソフトのアンチ・スパムツールは試してみました。現在、訳あって『Spam Mail Killer』を半年間使っています。非常に優秀なツールだと思います。ただし、ヘルプを含めて使いこなしに難があります。また、こうしたアンチ・スパムツールの中には、CSVでログを取ってくれるものがあります。 それから、話は戻りますが、私は、VBAで、必要な部分をテキストファイルから抜き出すことは可能です。ただし、抜き出しパターンを作るためには、その元の正確なログがないと、むつかしいかもしれません。 最近のスパムは、悪質化の一途で、国をまたいだネットワークがあるようですね。英語の(スパイウェア付き)スパムの一拠点送信型とは、かなり状況が違うようです。 なお、私は、『迷惑メール(spam)撲滅指摘調査会』で、対策法を学びました。

参考URL:
http://www2g.biglobe.ne.jp/~stakasa/spam-j.html
  • matsu_jun
  • ベストアンサー率55% (146/265)
回答No.2

nopusu様 こんにちわ。 迷惑メールって、本当に迷惑ですよね。nopusuさんの様に迷惑メールに前向きに立ち向かう姿勢、 思わず応援したくなります。私にも根性があればよいのですが、振り分けすらできずに放ってあります。 さて、2000件もの迷惑メール、既にエクセルのファイルに取り込み済みであれば余計なおせっかいなのですが、 もしまだお済みでないのならご参照いただければ幸いです。 どのメールソフトを御利用かは存じませんが、例えばOutlook Expressを開いたときの右上のメール件名一覧から 任意のメールをデスクトップにドラッグすると.emlという拡張子のついたファイルが出来上がります。 emlファイルとは、ある一件名のメールの内容を保存したファイルなのですが、このファイルには2つの特徴があります。 1) メール本文や添付ファイルの内容だけでなく、送信元、宛先、日時、件名などの書かれたヘッダ情報が付加されている。 2) メモ帳で開いて読むことのできるファイル(この種のファイルをテキストファイルと呼ぶ)である。 迷惑メールには送信元が偽装されているものが多くありますが、ヘッダ部には、どのサーバを経由して メールがたどり着いたかを示す「Received」なる項目が付いていますので、これをデータベースの要素に加えると よろしいのではないでしょうか。 メモ帳で開いて読むことができるということは、すなわちExcelでも容易に読み込むことができる (ファイルの拡張子を.emlから.csvに変更してダブルクリックすると分かりやすいです) ということです。ということは、マクロなどを利用して自動的にファイルの内容を取得し、Excelのファイルにすることが できるということになります。 メールの内容までデータベース化する場合は、他にも文字コード(日本語などの文字を数字に置き換えるルール)や BASE64デコード(添付ファイルをメールに付加する情報の変換法)など学習なさる必要があるかもしれませんが とりあえずは御利用のメールソフトがemlファイルに出力(エクスポート)することが可能かを御確認なされるとよいかと存じます。 分からない用語などありましたら本欄にて補足いたしますし、マクロの御相談でしたら、回答者No.1のWendy02様をはじめ 詳しい方がこのサイトにはたくさんいらっしゃいますのでお力添えをいただけるかもしれませんね。 では、素晴らしいデータベースになることをお祈りいたします。頑張ってください。 #Wendy02様 本回答中でお名前を引き合いに出させていただきました。誠に申し訳ございません。

  • Wendy02
  • ベストアンサー率57% (3570/6232)
回答No.1

こんにちは。 >届いた日付(月、日)、曜日、時間のデータをエクセルに取り込み集計してグラフにできるといいなと思っています。 私も、きっと、5年前ぐらいだったら、それをしていたと思います。それをする集中力がないのですが、面白いと思います。 その削除ログが、どのようなものかによっても決まってくると思います。切り分けが最初必要な気がします。CSVで統計が出てくるものなら良いかもしれませんが。 日付は日付 単に、Countif関数で日付で勘定すればよいと思いますが、時間記録があるので、一旦、シリアル値でしたら、Int関数で、時間情報を抜いたほうが良いかと思います。 曜日は曜日 Weekday関数で、Countif で取ればよいと思います。 時間は時間 Hour関数を使います。 ただ、私個人の意見で、余計なことかもしれませんが、種類別にしないと、統計としては、あまり意味がないような気がします。ベイジアン理論を使ったツールがどうなっているかは分りませんが、区分けの仕方が違ったような気がします。 そのデータの中から、何かの文字をキーにして、並べ替えをしたいものですね。Find関数とか、Countif関数で、文字列から探すしかないと思いますが。IPアドレスが残っていれば、それを使えばよいですね。 中国系とか英語系とか、日本のもので完全なスパムと、一般広告系とか大分類はしないと、統計の内容がボケてしまうような気がしています。私は、一般広告系を除いて、数はあっても、出元は、あまり多くないような気がします。 ながなが書きましたが、応援しています。

関連するQ&A