2003年10月6日

育てるスパムフィルタ

「POPFile」というメールフィルタリングツールを入れてみた。
うちはSPAMメールが多いから特定のキーワードでフィルタリング、
というわけには行かないのが悩みどころだったけど、
POPFileはコレは普通の、コレはSPAMという具合に、
何度か教えていくと賢くなって自動判別する、という。

もちろん、SPAMの分類だけじゃなくて、
仕事用とプライベート用など、いろんな用途に使える。
ソフトが学習していく、というのが面白い?ところ。
proxyサーバとして動作するから、
メールは普通に送受信できるというのも有難い。

今日1日メールを受信して、学習させて、
56通のメールが82.14%の精度で分類された。
最初のホントのおバカさんな時も含めてだから、
ごく最近の分類精度は結構高いと思う。
と言っても、56通のうち40通がSPAMだから、
違いもなんも学習できてるレベルじゃないけど(^^;
(ウィルスメールもSPAMとして分類している。)

週末は受信数が少ない。
これから1週間でどれだけ精度が上がるか楽しみ。
ネット上で導入例を見た感じでは99.8%なんてのもある。

育てるフィルタツールってのは、
考え方としては面白いかもね。
今まで「Viagra」でフィルタかけとくと1日10通ぐらいかかってた。
でも「Viag___ra」とか「V.i.a.g.r.a」なんてされるとかからない。
正規表現使ってパターン作ってると面倒だったのよね。
ちょっと期待できるかな、今回のは。

0 コメント:

コメントを投稿