[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[debian-users:47774] Re: SpamAssassin のベイジアンフィルター学習



武藤@Debianぷろじぇくとです。

At Wed, 13 Dec 2006 14:50:03 +0900,
peko wrote:
> ベイジアンフィルタのDB学習についてなのですが、これは、他人が集めたスパム
> を使用しても特段問題はないのでしょうか?(送信先Toについても集計されてい
> るため他人のは使用しないほうが良いとかはないでしょうか?)
> ※注:同じ職場なので、メール内容にそれほどの差異はないと想定しています。
> 
> それと、今は各ユーザーのホームに個別にベイジアンフィルタのデータを持って
> いますが、面倒そうなので、全ユーザーで共通のフィルター運用ができればと思っ
> ているのですが、そのような方法はあるのでしょうか?

各ユーザー設定である~/.spamassassin/user_prefsを見てみると、
最初の行に「詳細は perldoc Mail::SpamAssassin::Conf を見よ」
とありますね。で、このperlマニュアルに上記2点への答えが
記述されています。

bayes_path /path/to/file (default: ~/.spamassassin/bayes)
           Path for Bayesian probabilities databases.  Several databases will
           be created, with this as the base, with "_toks", "_seen" etc.
           appended to this filename; so the default setting results in files
           called "~/.spamassassin/bayes_seen", "~/.spamassassin/bayes_toks"
           etc.

           By default, each user has their own, in their "~/.spamassassin"
           directory with mode 0700/0600, but for system-wide SpamAssassin
           use, you may want to reduce disk space usage by sharing this across
           all users.  (However it should be noted that Bayesian filtering
           appears to be more effective with an individual database per user.)

#複数同時書き込みのときのロックとかは大丈夫なんかな?BDBだし…
-- 
武藤 健志@ kmuto @ kmuto.jp
           Debian/JPプロジェクト   (kmuto@debian.org, kmuto@debian.or.jp)
           株式会社トップスタジオ  (kmuto@xxxxxxxxxxxxxxx)
URI: http://kmuto.jp/ (Debianな話題など)