nDiki

2009年1月18日 (日)

bsfilter のトークンと Twitter

bsfilter を使った Twitter 発言のフィルタリングのため、bsfilter仕様を確認していたところ、トークン扱いにする文字種が以外に少ないことに気がついた。 日本語については漢字とカタカナしか見ていない。

うーん、これだと Twitter の発言のトークンとしてはちょっと物足りないな。 変更するにはソースをいじる必要がありそう。 メール処理を前提にした bsfilter ではなく、汎用のベイジアンフィルタを使うようにする方がよさそうだ。

[ 1月18日全て ]

About Me

Naney Naney (なにい)です。株式会社ミクシィで SNS 事業の部長をしています。

nDiki1999年1月に始めたコンピュータ日誌を前身とする NaneyWeb 日記(兼パーソナルナレッジベース)です。ちょっとしたノートは nNote にあります。

※内容は個人的見解であり所属組織とは関係ありません。

月別インデックス
Process Time: 0.197002s / load averages: 0.93, 0.80, 0.90
nDiki by WATANABE Yoshimasa (Naney)
Powered by DiKicker