トップ(最新)

nDiki : 形態素

形態素 - morpheme

関連情報

スポンサード リンク

Related term

2000年6月27日 (火)

PostgreSQL日本語のあるカラムの index がうまくいかない? このエントリーを含むはてなブックマーク

PostgreSQL のテーブルに日本語形態素を text 型として insert。 このカラムでなぜか where fieldname = '日本語' してもマッチしない。 where fieldname = 'alphabet' はマッチする。 一昨日はこの振舞いで悩み半日すぎてしまった。

Debian パッケージを 7.0.2-2(woody) から 6.5.3-18(potato)にしても症状はおなじ。 ちなみに、Multibyte は UNICODE を指定。 パッケージ自体も Multibyte は enable になっているようだ。

いろいろ調べてみると index をこのカラムにはっているとマッチしなくなるようだ。さらに調べると BTree index は駄目で Hash index ならマッチする事を発見。

そんなに PostgreSQL を使いこんでいるわけではないんだけど、既知の問題なのかな? それとも、どこかで間違いを犯しているのだろうか。

スポンサード リンク


[ 6月27日全て ]

Related web page

MeCabで、キーワード抽出 - プログラマになりたい
 <strong>形態素</strong>解析器として圧倒的な性能を誇るMeCabですが、出来る事は<strong>形態素</strong>解析にとどまりません。公式ページにも載っているように、辞書さえカスタマイズすればひらがな⇔カタカナ変換やAutoLinkの作成といったことまで出来ます。  WikipediaのデータとMeCabを使えば、高速なキーワード抽出が出来ないかなと思い試してみました。辞書の定義にコストを書けば、長いキーワードを優
http://d.hatena.ne.jp/dkfj/20080806/1217984258
Google Japan Blog: 大規模日本語 n-gram データの公開
突然ですが&#12289;穴埋めクイズです&#12290;下線部に入る単語はなんでしょう? グーグルで_____おそらく&#12289;&#12300;検索&#12301;&#12300;調べる&#12301;&#12300;探す&#12301;といった単語を思いつくのではないでしょうか&#65311; 実際に&#12289;Webにあるドキュメントをくまなく調べ&#12289;&#12300;グーグルで&#12301;の後にくる単語を調べると&#12289;&#12300;検索&#12301;が1位であるとがわかります&#12290;一般に&amp;
http://googlejapan.blogspot.com/2007/11/n-gram.html
ITmedia Biz.ID:Yahoo!の日本語形態素解析エンジンAPIを公開
Yahoo!JAPANで使われている日本語<strong>形態素</strong>解析エンジンのAPIを公開。文章に含まれる特徴的な単語などが分かり、他のAPIと組み合わせたマッシュアップなどの活用を期待している。 2007年06月18日 19時45分 更新  ヤフーは6月18日、サービスAPI「日本語<strong>形態素</strong>解析Webサービス」を公開した。Yahoo!JAPANで使われている日本語<strong>形態素</strong>解析エンジンを、外部の開発者などが無料で利用できる。
http://www.itmedia.co.jp/bizid/articles/0706/18/news090.html
形態素解析エンジン言語郎 - とは?
自然言語で書かれた文を、<strong>形態素</strong>(言語で意味を持つ最小単位)に分割する技術です。この際、辞書 (「品詞」などの情報つきの単語リスト)中の情報を参照することで、「品詞」、「活用形」、「読み」等の情報を得ることが可能です。
http://gengoro.zoo.co.jp/
Sen - FrontPage
SenはLGPL(Lesser General Public License)で配布されています。 Senをソフトウェアに組み込んで利用しても、ソースコードを公開する必要はありません。Senには、機能を拡張するプロセッサの仕組みがありますが、追加したプロセッサを公開する必要もありません。ただし、Sen自身に改変を加えた場合は、改変を加えた部分を公開してください。 動作確認済環境 Linux (Debian GNU/Linux)で動作確認
http://ultimania.org/sen/
[を] 日本語形態素解析入門
山下達雄 / 日本語<strong>形態素</strong>解析入門 Version 0.9.1 / 1999&lt;http://nais.to/~yto/doc/tech/jma/jma19990514.pdf&gt; (1.4M)奈良先端科学技術大学院大学(NAIST)自然言語処理学講座(松本研)にD2の学生として所属していた1998年6月9日のミーティングで、新入生(M1) 向けに「日本語<strong>形態素</strong>解析」の入門講座を行った。その際に用いた資料を1999年5月14日に改定したものをPDF化して公開する。文書自体は Version 0.9
http://nais.to/~yto/clog/2005-03-30-2.html

■よく検索されるキーワード

提案書(65) perl(54) 書き方(49) torrent(49) linux(40) debian(35) アジェンダ(33) 使い方(31) windows(31) x31(30) svn(26) ssh(25) tc-1(25) サンプル(23) usb(22) java(22) ganttproject(21) mp980(20) 画像(20) tortoisesvn(20) インストール(19) 手帳(19) cvs(19) 壁紙(19) a6(18) thinkpad(17) subversion(16) 石垣祐馬(16) ほぼ日手帳(16) 作り方(16) 修理(16) 動画(15) 日本語(15) 充電式カイロ(15) ノート(14) ダイソー(14) 方眼(14) ヨドバシ(14) リフィル(13) 秋葉原(12) ダウンロード(12) apache(12) アジェンダとは(12) iwgp(12) 設定(12) c#(11) mp3(11) ヨドバシカメラ(11) テンプレート(11) 無線lan(11) ubuntu(11) nikon(11) dropbox(11) システム手帳(11) porter(11) クラリチン(10) 筆まめ(10) centos(10) ヤマダ電機(10) window(10) ポメラ(9) フリー(9) リポジトリ(9) イメージテック(9) wiki(9) flex(9) xampp(9) フォーマット(9) terastation(8) flash(8) gmail(8) ドラマ(8) proxy(8) rcs(8) 無料(8) 温度計(8) トランサミン(8) constant(8) truecrypt(8) google(8)

この日記のはてなブックマーク数 Add to Google RSS

Process Time: 1.380871s / load averages: 0.33, 0.23, 0.18
nDiki by WATANABE Yoshimasa (profile)
Powered by DiKicker
Base theme by Nana (for tDiary)