HOME | ドキュメント |  ブログ  |  BBS  |  瓦版  | 将棋プロジェクト |  物置小屋   

PythonからC++クラスを使う Python パイソン UDP通信のサンプルコード
 道標
象歩
象歩ブログ
ドキュメント
自転車整備ノート
C/C++
Linux 備忘録
パソコン整備ノート
不健康日記
不健康日記(2)
不健康日記(3)
Python パイソン
PythonからCプログラ~
Python から C++ クラ~
PythonからC++クラス~
SpamBayes 日本語化
UDP通信のサンプルコ~
XMLRPC サンプルコー~
セキュリティ
Vine ヴァイン
Zope2 (ゾープ 2.x 系)
象歩BBS
Web瓦版
将棋プロジェクト
物置小屋
 リンク
python.org
document
SourceForge.net: Python
wiki.python.org
wiki.python.org/moin/TkInter
PIL/Tkinter
Mark Hammond's Free Stuff
Tcl/Tk Manual Pages
Python development with Eclipse and Ant
Dive Into Python
Python HOWTOs
Richard Gruet's Home page
日本Pythonユーザ会
Python チュートリアル
Python 標準ドキュメント
Python 2.4 Quick Reference
正規表現 HOWTO
PythonSpeed 日本語訳
Python おもちゃばこ (仮称)
ASPN Python Cookbook
PEP 8 -- Style Guide for Python Code
Pythonイントロスペクション入門
Pythonでの永続性管理
numarray日本語訳
複雑なモデルをシンプルにするSimPy
python での行列・ベクトル数値計算
Gembook.jp
NoboNoboRTD
岩田さん
松本さん
増田さん
py2exeモジュールについて
Django オンラインドキュメント和訳(へのリンク)
Tcl/Tk と Tkinter
SQLObject 日本語訳
The Python IAQ: Infrequently Answered Questions 日本語訳
Python 調査報告
Django オンラインドキュメント和訳
紫藤のページ
M.Hiroi's Home Page
Tcl/Tk 屋根裏が入口

SpamBayes 日本語化  [更新日: 2007年10月04日 ]

SpamBayes

SpamBayes (スパムベイズ) は、ベイズ理論を応用した高性能なスパムフィルタです。 POP3 Proxy や Procmail のフィルタとして利用可能です。 オリジナルは日本語のメールに特に対応してませんが、 それでもかなりの割合で日本語のスパムメールをはじいてくれます。 配布元は sourceforge です。

日本語ローカライズ版

SpamBayes日本語版は日本語トークン抽出処理を追加し、 また web インターフェースに日本語パッチあてました。 副作用を発生させないよう修正は最小限にとどめたつもりです。 ファイルは ここ に置いてあります。

SplitterForU.py                            -- 日本語スプリッタ (追加)
spambayes-1.0.4.Dibbler-iso2022jp.patch    -- Web インタフェース (共通)
spambayes-1.0.4.PyMeldLite-iso2022jp.patch -- Web インタフェース (共通)
spambayes-1.0.4.ImapUI-RFC2060.patch       -- Web インタフェース (Imap 用)
spambayes-1.0.4.ProxyUI-iso2022jp.patch    -- Web インタフェース (POP3 Proxy 用)
spambayes-1.0.4.tokenizer-iso2022jp.patch  -- トークン抽出処理パッチ

パッチを適用済みのファイルや spec ファイルも置いてあります。

spambayes-1.0.4.tar.gz     -- オリジナル
spambayes-1.0.4.jp.tgz     -- オリジナル + 日本語パッチ
spambayes.spec             -- RPM 作成用 spec ファイル

また、日本語スプリッタは UnicodeBlockTokenizer - tokuhirom's Wiki から頂戴してきたものを改造して使用してます。 この辺の話は 象歩ブログ 149, 148, 123 を参照してください。

インストール

VineLinux 用 RPM はここ に置きます。Vine の ftp ミラーサイトからも get 出来ます。 apt-get でインストールする場合 Vine-3.2 では extras 扱いなので、 /etc/apt/source.list に extras を追加します。

## Vine Linux 3.2
rpm     [vine] http://updates.vinelinux.org/apt 3.2/$(ARCH) main devel plus extras updates
rpm-src [vine] http://updates.vinelinux.org/apt 3.2/$(ARCH) main devel plus extras updates

オリジナルソースからインストールする場合は、上記 spambayes-1.0.4-jp.tgz を使うか、 ソースを本家から ダウンロード してパッチを当てます。

$ tar xvzf spambayes-1.0.4.tar.gz
$ cp SplitterForU.py spambayes-1.0.4/spambayes/
$ patch -p0 < spambayes-1.0.4.Dibbler-iso2022jp.patch
$ patch -p0 < spambayes-1.0.4.ImapUI-RFC2060.patch
$ patch -p0 < spambayes-1.0.4.ProxyUI-iso2022jp.patch
$ patch -p0 < spambayes-1.0.4.PyMeldLite-iso2022jp.patch
$ patch -p0 < spambayes-1.0.4.tokenizer-iso2022jp.patch

パッチは 1.0.4 用に作りましたが、1.0.3 でも利用できるようです。

インストール方法はソースの README.txt に書いてあります。 本家ページには他にも色々な情報があります。 たとえば、次のようにしてインストールできます。

$ cd spambayes-1.0.4
$ python setup.py build
$ su
# python setup.py install

使い方

IMAP サーバでの使い方は、いちおう ここ に書きました。 本家には UNIX, Mac OS, Windows 用に、個別の説明があります。

履歴

  • 2005-09-04: spambayes-0.1.4-jp 日本語トークン抽出処理を追加しました。