nDiki : UCS

UCS - Universal Multiple-Octed Coded Character Set

ISO/IEC 10646。

符号化文字集合の一つ。

スポンサード リンク

2003年12月12日 (金)

[ Java ] Unicode (UCS) -> 別の charset

Java の String を 'abc' なら US-ASCII (ANSI_X3.4-1968)に、'あいう' なら ISO-2022-JP にしたいという話。 やっぱり文字列中の全ての文字について候補の charset に含まれているか見ていくしかないのか?

Mew だとちゃんと、US-ASCIIだけならus-ascii で、日本語が含まれていれば iso-2022-jp でメールを送ってくれるがここら辺はどうやっているんでしょ。 ソースを見てみるか。

[ 12月12日全て ]

2006年3月8日 (水)

Mule-UCS の設定

reStructuredText では表を作る時は文字数で桁揃えして、表セルを表現していく。 ASCII 文字などフォント幅がいわゆる半角幅であるものだけならば、良いのだが全角幅の文字がある場合はちょっと厄介である。

文字数的には1文字なのだが、テキストファイル上では2文字分の幅を取るので見た目上桁が揃わなくなってしまう。 というかそれを忘れて桁を揃えておくと、パーサに怒られる。

このためにパッチがあったり、Docutil 0.4 ではこの対策がほどこされたりしている(不完全であるが)。

さらに厄介なのが Unicode 変換がからむところで、 Emacs + Mule-UCS ではいくつかの(いわゆる)全角文字は UTF-8 で保存すると違う文字に変換されてしまい、これまた Docutils のパーサに、桁があっていないと怒られることになる。

できるだけ全角文字はそのままにしておくということで、以下の設定を追加しておいた。

 (require 'un-define)
 (un-define-change-charset-order
  (append '(ascii japanese-jisx0208)
          unicode-basic-translation-charset-order-list))

またバックスラシュと円記号の方も混乱が少ないように

 (require 'un-supple)
 (un-supple-enable 'windows)

を追加してく。

[ 3月8日全て ]

2008年7月18日 (金)

今日のさえずり: NOMO って書くと消しゴムっぽい

2008年07月18日

  • 09:20 お年玉切手シート2枚郵便局でもらってきた。交換期間もうすぐ終了。[mb]
  • 12:22 帰省往路の新幹線、希望の車両で指定席確保。[mb]
  • 12:24 NOMO って書くと消しゴムっぽい。[mb]
  • 15:53 sid アップデートしたら ** WARNING ** Failed to load ToUnicode mapping: EUC-UCS2 が出て hyperref のしおりが文字化けするようになった。
  • 20:02 掃除機かけたらこの時間になった。帰る。[mb]
[ 7月18日全て ]

2008年7月19日 (土)

今日のさえずり: デックス東京ビーチモンベルなくなってたか

2008年07月19日

[ 7月19日全て ]

About Me

Naney Naney (なにい)です。株式会社ミクシィで SNS 事業の部長をしています。

nDiki1999年1月に始めたコンピュータ日誌を前身とする NaneyWeb 日記(兼パーソナルナレッジベース)です。ちょっとしたノートは nNote にあります。

※内容は個人的見解であり所属組織とは関係ありません。

follow us in feedly

月別インデックス
Process Time: 0.071952s / load averages: 0.36, 0.45, 0.49
nDiki by WATANABE Yoshimasa (Naney, Google profile)
Powered by DiKicker