nDiki : 2009年01月18日

2009年1月18日 (日)

bsfilter のトークンと Twitter

bsfilter を使った Twitter 発言のフィルタリングのため、bsfilter仕様を確認していたところ、トークン扱いにする文字種が以外に少ないことに気がついた。 日本語については漢字とカタカナしか見ていない。

うーん、これだと Twitter の発言のトークンとしてはちょっと物足りないな。 変更するにはソースをいじる必要がありそう。 メール処理を前提にした bsfilter ではなく、汎用のベイジアンフィルタを使うようにする方がよさそうだ。

スポンサード リンク

今日のさえずり: 「あぐり」のサントラで爽やかな朝(寝坊)

2009年01月18日

  • 09:04 「あぐり」のサントラで爽やかな朝(寝坊)。 [mb]
  • 15:07 冷蔵庫見てきた。パナソニックで決まりだな。後は値段。 [mb]
[ 1月18日全て ]

About Me

Naney Naney (なにい)です。株式会社ミクシィで SNS 事業の部長をしています。

nDiki1999年1月に始めたコンピュータ日誌を前身とする NaneyWeb 日記(兼パーソナルナレッジベース)です。ちょっとしたノートは nNote にあります。

※内容は個人的見解であり所属組織とは関係ありません。

月別インデックス
Process Time: 0.050002s / load averages: 0.17, 0.43, 0.50
nDiki by WATANABE Yoshimasa (Naney)
Powered by DiKicker