- ベストアンサー
迷惑メールの識別方法
技術者よりの質問になってしまうかもしれませんが、メーラーがどのように迷惑メールかどうかを判別しているかを調べています。 理由は、当方で送信したHTMLメールが、一部のメーラーで迷惑メールとして識別されてしまう、というクレームを先方からいただいたからです。 メーラーの種類は教えてもらってないのですが、 ・Outlook Express ・Outlook 2003 ・Beckey! ・Thunderbird で正常に受信されれば問題ありません。 迷惑メールフィルタの仕様が公開されているとは思いませんが、少しでもヒントがあれば教えてください。 関連情報を取り扱っているHPでもかまいません。お願いします。
- みんなの回答 (2)
- 専門家の回答
質問者が選んだベストアンサー
- ベストアンサー
http://popfile.sourceforge.net/cgi-bin/wiki.pl?JP_POPFileDocumentationProject こちらのページをご覧ください。 ほぼ、スタンダードなフィルタリングソフトだと思われるPOPFILEについて解説されているページです。 見てもらえば分かると思いますが、通常のフィルタリングソフトの場合 ・ブラックリスト及びホワイトリスト ・ベイズ法を用いてスパムに特有のキーワードを学習して行くタイプの2種類です。 お気の毒としか言いようがないですが、迷惑メールの認識は個人によって変わってくる上にThunderbirdなどのメーラの迷惑メールフィルタリング機能は、学習させないと意味がない代物です。 繰り返しになりますが、どれが迷惑メールか分からない状態では殆どのメールが迷惑メールとして認識されてしまいます。 (特にThunderbird) だから、ちゃんと学習させましょうと言ってあげましょう(^_^; 気にすることはありません。
その他の回答 (1)
本文中に日本語が含まれていなかったり、エンコードが原因で文字化けして全部半角文字だと判別された場合などは迷惑メールとして扱われる場合があります。 また、登録完了の通知などで自動配信されるメールも時々迷惑メールとなる場合があるみたいです。
お礼
本文中に日本語が含まれていなかったり…ということは、HTMLメールが全部画像の場合も危ない、ということですね。 ありがとうございます。
お礼
単純にリストとか、固定されたアルゴリズムによる分類かと思ったんですが、「学習」させるんですね。 そしてこの学習して分類するアルゴリズム?がベイズ理論で、これを使うのがスタンダードなやり方である、と。 となると、確かにユーザーによって千差万別ですね。やれやれ… ありがとうございます。