- ベストアンサー
ベイズ理論と、SPAMメールのフィルター
SPAMメールをブロックするソフトが、ベイズの理論というのを使っているのだそうですが、 http://japan.cnet.com/special/story/0,2000050158,20052855,00.htm http://www.tom.comm.waseda.ac.jp/~ike/column/0006.html このあたりを読んでもいまいち、理屈がよく分かりません。 簡単な例で分かりやすく理解できないでしょうか?
- みんなの回答 (1)
- 専門家の回答
質問者が選んだベストアンサー
こんにちは、white-tigerさん http://hawaii.aist-nara.ac.jp/~shige-o/cgi-bin/wiki/wiki.cgi?%C6%FE%CC%E7%BC%D4%B8%FE%A4%B1%B2%F2%C0%E2#i5 を参考にされたらいかがでしょう。 ●スパムメールかどうか判断する手がかりは、 メールの内容に出てくる単語になります。 例えばスパムメールには、 「簡単に儲かる」という内容のものが多いとします。 ただし、「儲かる」という単語があったからといって、スパムメールとは限りません。 そこで統計をとって(あるいは推定で) 「儲かる」が出てくるとき、スパムメールである確率をいくら、という風に推定するわけです。 ★上記URLで出てくる例 P(むっすり顔|彼女は怒っている) = 0.9 とかいうところを P(「儲かる」|スパムメール) = 0.9 と読み替えてみるとわかりやすいでしょうか。 ●実際には、「儲かる」だけでなく、いくつかの単語があわせて使われるので、そういうことも考慮します。 その辺のことを想定しながら、white-tigerさんがあげているURLの説明を読まれたら、理解しやすくなるのではないでしょうか。
お礼
非常に分かりやすい説明をありがとうございます!