nDiki : 形態素
Related term
2000年6月27日 (火)
■ PostgreSQL で日本語のあるカラムの index がうまくいかない?

PostgreSQL のテーブルに日本語の形態素を text 型として insert。 このカラムでなぜか where fieldname = '日本語' してもマッチしない。 where fieldname = 'alphabet' はマッチする。 一昨日はこの振舞いで悩み半日すぎてしまった。
Debian パッケージを 7.0.2-2(woody) から 6.5.3-18(potato)にしても症状はおなじ。 ちなみに、Multibyte は UNICODE を指定。 パッケージ自体も Multibyte は enable になっているようだ。
いろいろ調べてみると index をこのカラムにはっているとマッチしなくなるようだ。さらに調べると BTree index は駄目で Hash index ならマッチする事を発見。
そんなに PostgreSQL を使いこんでいるわけではないんだけど、既知の問題なのかな? それとも、どこかで間違いを犯しているのだろうか。
- flashplayer-mozilla で日本語 (2004-11-14)
- Linux 上で Flex 2 SDK を使った Flash コンテンツ開... (2007-09-11)
- EasyPG で Emacs から .gpg ファイルを透過的に読み書き (2007-01-26)
- Linux で使えるデスクトップ検索ツール Beagle でローカルファイ... (2006-08-08)
- AWStats 6.0 (2004-05-21)
Related web page
<strong>形態素</strong>解析器として圧倒的な性能を誇るMeCabですが、出来る事は<strong>形態素</strong>解析にとどまりません。公式ページにも載っているように、辞書さえカスタマイズすればひらがな⇔カタカナ変換やAutoLinkの作成といったことまで出来ます。 WikipediaのデータとMeCabを使えば、高速なキーワード抽出が出来ないかなと思い試してみました。辞書の定義にコストを書けば、長いキーワードを優http://d.hatena.ne.jp/dkfj/20080806/1217984258
突然ですが、穴埋めクイズです。下線部に入る単語はなんでしょう? グーグルで_____おそらく、「検索」「調べる」「探す」といった単語を思いつくのではないでしょうか? 実際に、Webにあるドキュメントをくまなく調べ、「グーグルで」の後にくる単語を調べると、「検索」が1位であるとがわかります。一般に&http://googlejapan.blogspot.com/2007/11/n-gram.html
Yahoo!JAPANで使われている日本語<strong>形態素</strong>解析エンジンのAPIを公開。文章に含まれる特徴的な単語などが分かり、他のAPIと組み合わせたマッシュアップなどの活用を期待している。 2007年06月18日 19時45分 更新 ヤフーは6月18日、サービスAPI「日本語<strong>形態素</strong>解析Webサービス」を公開した。Yahoo!JAPANで使われている日本語<strong>形態素</strong>解析エンジンを、外部の開発者などが無料で利用できる。http://www.itmedia.co.jp/bizid/articles/0706/18/news090.html
自然言語で書かれた文を、<strong>形態素</strong>(言語で意味を持つ最小単位)に分割する技術です。この際、辞書 (「品詞」などの情報つきの単語リスト)中の情報を参照することで、「品詞」、「活用形」、「読み」等の情報を得ることが可能です。http://gengoro.zoo.co.jp/
SenはLGPL(Lesser General Public License)で配布されています。 Senをソフトウェアに組み込んで利用しても、ソースコードを公開する必要はありません。Senには、機能を拡張するプロセッサの仕組みがありますが、追加したプロセッサを公開する必要もありません。ただし、Sen自身に改変を加えた場合は、改変を加えた部分を公開してください。 動作確認済環境 Linux (Debian GNU/Linux)で動作確認http://ultimania.org/sen/
山下達雄 / 日本語<strong>形態素</strong>解析入門 Version 0.9.1 / 1999<http://nais.to/~yto/doc/tech/jma/jma19990514.pdf> (1.4M)奈良先端科学技術大学院大学(NAIST)自然言語処理学講座(松本研)にD2の学生として所属していた1998年6月9日のミーティングで、新入生(M1) 向けに「日本語<strong>形態素</strong>解析」の入門講座を行った。その際に用いた資料を1999年5月14日に改定したものをPDF化して公開する。文書自体は Version 0.9http://nais.to/~yto/clog/2005-03-30-2.html
■よく検索されるキーワード
提案書(65) perl(54) 書き方(49) torrent(49) linux(40) debian(35) アジェンダ(33) 使い方(31) windows(31) x31(30) svn(26) ssh(25) tc-1(25) サンプル(23) usb(22) java(22) ganttproject(21) mp980(20) 画像(20) tortoisesvn(20) インストール(19) 手帳(19) cvs(19) 壁紙(19) a6(18) thinkpad(17) subversion(16) 石垣祐馬(16) ほぼ日手帳(16) 作り方(16) 修理(16) 動画(15) 日本語(15) 充電式カイロ(15) ノート(14) ダイソー(14) 方眼(14) ヨドバシ(14) リフィル(13) 秋葉原(12) ダウンロード(12) apache(12) アジェンダとは(12) iwgp(12) 設定(12) c#(11) mp3(11) ヨドバシカメラ(11) テンプレート(11) 無線lan(11) ubuntu(11) nikon(11) dropbox(11) システム手帳(11) porter(11) クラリチン(10) 筆まめ(10) centos(10) ヤマダ電機(10) window(10) ポメラ(9) フリー(9) リポジトリ(9) イメージテック(9) wiki(9) flex(9) xampp(9) フォーマット(9) terastation(8) flash(8) gmail(8) ドラマ(8) proxy(8) rcs(8) 無料(8) 温度計(8) トランサミン(8) constant(8) truecrypt(8) google(8)■注目キーワード
購入 買った 発売日 フリー 無料 価格 値段 作り方 選び方 使い方 方法 設定 サンプル ダウンロード 限定 在庫 予約 穴場 比較 検証 レビュー 感想 評価 評判 使用感 使ってみた 口コミ 噂 最新 MP3 動画 意味 お薦め お勧め おすすめ 便利 Blog ブログ mixi 修理 デザインProcess Time: 1.380871s / load averages: 0.33, 0.23, 0.18
nDiki by WATANABE Yoshimasa (profile)
Powered by DiKicker
Base theme by Nana (for tDiary)



スポンサード リンク