• ベストアンサー

ベイズ理論と、SPAMメールのフィルター

SPAMメールをブロックするソフトが、ベイズの理論というのを使っているのだそうですが、 http://japan.cnet.com/special/story/0,2000050158,20052855,00.htm http://www.tom.comm.waseda.ac.jp/~ike/column/0006.html このあたりを読んでもいまいち、理屈がよく分かりません。 簡単な例で分かりやすく理解できないでしょうか?

質問者が選んだベストアンサー

  • ベストアンサー
  • answer
  • ベストアンサー率50% (3/6)
回答No.1

こんにちは、white-tigerさん http://hawaii.aist-nara.ac.jp/~shige-o/cgi-bin/wiki/wiki.cgi?%C6%FE%CC%E7%BC%D4%B8%FE%A4%B1%B2%F2%C0%E2#i5 を参考にされたらいかがでしょう。 ●スパムメールかどうか判断する手がかりは、 メールの内容に出てくる単語になります。 例えばスパムメールには、 「簡単に儲かる」という内容のものが多いとします。 ただし、「儲かる」という単語があったからといって、スパムメールとは限りません。 そこで統計をとって(あるいは推定で) 「儲かる」が出てくるとき、スパムメールである確率をいくら、という風に推定するわけです。 ★上記URLで出てくる例  P(むっすり顔|彼女は怒っている) = 0.9 とかいうところを  P(「儲かる」|スパムメール) = 0.9 と読み替えてみるとわかりやすいでしょうか。 ●実際には、「儲かる」だけでなく、いくつかの単語があわせて使われるので、そういうことも考慮します。 その辺のことを想定しながら、white-tigerさんがあげているURLの説明を読まれたら、理解しやすくなるのではないでしょうか。

参考URL:
http://hawaii.aist-nara.ac.jp/~shige-o/cgi-bin/wiki/wiki.cgi?%C6%FE%CC%E7%BC%D4%B8%FE%A4%B1%B2%F2%C0%E2#i5
white-tiger
質問者

お礼

非常に分かりやすい説明をありがとうございます!

関連するQ&A