以前 Twitter ベイジアンフィルタプロキシを作ったんだけれど、この時は「不要な発言は見なくて済むようにしたい」という理由だった。 今はどうかというと、follow 数増えたのでもう基本全部読むなんてことはなくて、P3:PeraPeraPrv の抽出機能で気になる語を含む発言だけピックアップして斜め読みで済ませることが多い。 しかしキーワード抽出の場合はキーワードを随時登録していかなければならないので、よろしくないところがある。
そこでベイジアンフィルタで、不要な発言をフィルタリングするのではなく有用な発言をピックアップさせてみることにした。 以前作ったプログラムが今でもそのまま動いたので、span と clean をいれかえて使ってみた。
既知のキーワードから自動的に関連メッセージをピックアップするフィルタとして学習が進んでくれれば万歳。
Naney (なにい)です。株式会社ミクシィで SNS 事業の部長をしています。
nDiki は1999年1月に始めたコンピュータ日誌を前身とする Naney の Web 日記(兼パーソナルナレッジベース)です。ちょっとしたノートは nNote にあります。
※内容は個人的見解であり所属組織とは関係ありません。