procmail と bsfilter

procmail で,どのレシピによって弾かれたものかをヘッダにつけてくれる tips があるらしい.便利そう.

ちなみに,うちではもはや procmailspam をはじくのは限界で,2003 年 9 月頃から bsfilter を併用している.[2004-11-24] の時点で,

ちなみに私の bsfilter が運用されて 1 年ちょっとたつが,現時点で第 1 種の過誤が 3 くらい,第 2 種の過誤が 475 で,阻止されたメールは 3081….うーん,9 割くらいか.
という状況だったんだけど,今ためしに阻止されたメールを数えてみたら,7852 通もあった.7 ヵ月で 5,000 通近く.なんか指数関数的に増えてません??



てなわけで,月ごとに集計してみた.spam をためているディレクトリで,

ls -ltr | awk '{print $6}' | uniq -c

でおおまかな集計をとる.また,第 2 種の過誤 (フィルタをすり抜けてきてきた spam) についても同様に数える.第 1 種の過誤 (フィルタリングされてしまったホワイトなメール) は今まで 3 通くらいしかない (人間でも判別が難しいケースだった.しかもここ 1 年半ほどは皆無) ので無視.



spam

これがグラフ.横軸は月.おお,見事に指数関数的に spam が増えてます.でもそのほとんどはブロックされてて,MUA に届いてしまう件数は特に増えてない.ということは認識率は上がっていると考えていいのかな?



ちなみに not filtered (フィルタリングできなかった spam) が最初 500 くらいまでいっちゃってるのは,SOBIG ウイルスの襲撃があったから.もちろんアンチウイルスが無効化してくれたやつが届いてたんだけど,それでもあまりの量にキレて,それで bsfilter を入れましたというのがグラフから読み取れる.



また,第 1 種の過誤に比べて第 2 種が圧倒的に多いということから,「疑わしきは罰せず」的システムであることがわかる.inbox にすり抜けた spam が届くのが嫌なのか,spam box に紛れ込んだホワイトなメールを探すのが嫌なのかによって使用感は違うだろう.私は完璧に後者な人間なのでデフォルトの設定でちょうどよいけど,カットオフを修正すればもっと厳しくもできるはず.



それにしても 900 通/月か.まだまだ増えるんだろうか.最近は bsfilter をすりぬける巧妙な spam (特に単語が書いておらずランダム文字列の URL だけのものや,知人からを装った日本語メール等) も増えてきていて,困ったなあ.