nDiki

2009年1月18日 (日)

bsfilter のトークンと Twitter

bsfilter を使った Twitter 発言のフィルタリングのため、bsfilter仕様を確認していたところ、トークン扱いにする文字種が以外に少ないことに気がついた。 日本語については漢字と片仮名しか見ていない。

うーん、これだと Twitter の発言のトークンとしてはちょっと物足りないな。 変更するにはソースをいじる必要がありそう。 メール処理を前提にした bsfilter ではなく、汎用のベイジアンフィルタを使うようにする方がよさそうだ。

[ 1月18日全て ]

About Me

Naney Naney

Naney (なにい)です。株式会社ミクシィで SNS 事業の部長をしています。

About nDiki

nDiki1999年1月に始めたコンピュータ日誌を前身とする NaneyWeb 日記(兼パーソナルナレッジベース)です。

#nNote タグがついている記事は他の記事に比べて、より断片的・未整理・不完全なちょっとしたノートです。まだ結論に至っていない考えなども含まれます。頻繁/大幅に更新したり削除したりすることがあります。

※本サイトの内容は個人的見解であり所属組織とは関係ありません。

Other Notes

ナレッジベースアプリケーション Obsidian で書いているノートの一部を notes.naney.org で 公開しています。

月別インデックス
Process Time: 0.171346s / load averages: 0.95, 0.77, 0.65
nDiki by WATANABE Yoshimasa (Naney)
Powered by DiKicker