nDiki : Unicode

Unicode (ユニコード)

スポンサード リンク

2006年3月8日 (水)

Mule-UCS の設定

reStructuredText では表を作る時は文字数で桁揃えして、表セルを表現していく。 ASCII 文字などフォント幅がいわゆる半角幅であるものだけならば、良いのだが全角幅の文字がある場合はちょっと厄介である。

文字数的には1文字なのだが、テキストファイル上では2文字分の幅を取るので見た目上桁が揃わなくなってしまう。 というかそれを忘れて桁を揃えておくと、パーサに怒られる。

このためにパッチがあったり、Docutil 0.4 ではこの対策がほどこされたりしている(不完全であるが)。

さらに厄介なのが Unicode 変換がからむところで、 Emacs + Mule-UCS ではいくつかの(いわゆる)全角文字は UTF-8 で保存すると違う文字に変換されてしまい、これまた Docutils のパーサに、桁があっていないと怒られることになる。

できるだけ全角文字はそのままにしておくということで、以下の設定を追加しておいた。

 (require 'un-define)
 (un-define-change-charset-order
  (append '(ascii japanese-jisx0208)
          unicode-basic-translation-charset-order-list))

またバックスラシュと円記号の方も混乱が少ないように

 (require 'un-supple)
 (un-supple-enable 'windows)

を追加してく。

スポンサード リンク
[ 3月8日全て ]

2011年9月12日 (月)

今日のさえずり: 社内 Wiki 止まると停電より困る

2011年09月12日

[ 9月12日全て ]

2015年4月10日 (金)

今日のさえずり: ユーザーを馬鹿にしない

[ 4月10日全て ]

2017年12月22日 (金)

Alfred の workflow の引数の文字列は濁点・半濁点が分解されているので iconv で合成することにした

最近 Remember The Milk でタスクを検索した際に検索結果に出ないタスクがあっておかしいなと思っていたのですが、ようやく原因がわかりました。 Alfred から workflow でrumember を使ってタスク登録していたものの一部が検索できないようなので調べたところ、濁点・半濁点が分解された UTF-8 文字列で Remember The Milk に送られていたのです。 Remember The MilkWeb 版で入力や検索では濁点・半濁点が分解されていない文字が使われるため検索でマッチしていないのでした。

合成されている Unicode 正規化形式C (NFC) で統一したいのですが Alfred では選択する方法がありません。Keyword to Script テンプレートで作った Alfred workflow だと Run Script (/bin/bash) のひな型が

 query="{query}"

となるのですが、ここをいったん

 query=`echo "{query}" | iconv -f UTF-8-MAC -t UTF-8`

のようにして変換することにしました。 Remember The Milk への登録以外にもテキストファイルに追記する workflow や Slack に投稿する workflow も同様にして NFC で処理するように変更です。

すでに Remember The Milk に投稿したものは仕方ないので手動で検索してちまちま修正。テキストファイルに書いたものもわかる範囲で検索して書き換えました。ふう。Google ChromeUlysses はきちんと合成して表示してくれるので今まで気がつきませんでしたよ。

補足

ちなみに uconv -f utf-8 -t utf-8 -x nfc だと合成できていない文字があってうまくいきませんでした。

[ 12月22日全て ]

2018年9月9日 (日)

mixi日記ブックマーク絵文字とリンクシンボル絵文字を使う

mixi日記でつぶやくようにしたり Web 日記を書いたら Zapier を使ってmixi日記でつぶやくようにしたり最近しているのだけれど、ホーム画面内での日記の先頭部分表示だとハイパーリンクがある事がわかりにくいので、絵文字も使ってみることにした。

WWW 黎明期はリンクを表すシンボルは地球を含む図案が多かったけれど、今は鎖のような図案やサイト外へ出ていくイメージの図案が多くなった。今はもう world wide は当たり前になったということかな。

リンク

ブックマーク

[ 9月9日全て ]

2018年12月25日 (火)

2018年12月25日(火)の #nNote

ダッシュ

対で囲んで説明や副題を表す → em ダッシュ —
ホリゾンタルバー ―

Unicode 文字 HORIZONTAL BAR (U+2015)

長音記号 ー

Unicode 文字 KATAKANA-HIRAGANA PROLOGNED SOUND MARK (U+30FC)

[ 12月25日全て ]

2019年9月18日 (水)

MacGoogle 日本語入力 LRO #nNote

MacGoogle 日本語入力Unicode の LEFT-TO-RIGHT OVERRIDE (LRO) U+202D を入力する方法。

  1. 入力したい位置にカーソルを置く。
  2. メニューから「絵文字と記号を表示」を開く。
  3. 右上の検索フォームで 202D と入力する。
  4. 真ん中の文字コードの下の(見えない)文字をダブルクリックする。

これでカーソル位置に入力される。

MacGoogle 日本語入力から文字パレットがなくなったので以下の方法はもう使えない

  1. メニューから文字パレットを開く。
  2. 左側のリストで一般句読点を選択する。
  3. U+2020 行から U+202D のマスをクリック。

これでクリップボードにコピーされる。

[ 9月18日全て ]

2020年2月7日 (金)

ノートテキストファイル絵文字を最近使っている

最近ノートUnicode 絵文字を活用している。やはりカラフルだとノートテキストファイルの中で視認しやすい。

ノートテキストファイルの分類に応じたシンボルとして絵文字を全体の先頭の方においておけば iA Writer のファイルリストで区別しやすくなる。またテキストファイル中の各見出しの先頭にそれぞれの意味に合わせた絵文字を書いておくことで、ぱっと入力場所を探せる。

表したいことにマッチした絵文字が無い場合は適当に比喩的に近い絵文字を使う。 Unicode 絵文字の名前をみつつこの意味ではこの絵文字を使うなどのマイルールをちょっとずつ作っている。

このあたり絵文字の意味づけが人によって違ってくるところなので、みんなでルール化してもうまく運用できない気はしている。

[ 2月7日全て ]

2021年1月3日 (日)

良く使う絵文字 #nNote

ノートで使う絵文字

  • 🏢 Office Building U+1F3E2 (Unicode 6.0)
    • 仕事関連など
  • 📒 Ledger U+1F4D2 (Unicode 6.0)
    • 台帳
  • 📓 Notebook U+1F4D3 (Unicode 6.0)
  • 📔 Notebook with Decorative Cover U+1F4D4 (Unicode 6.0)
  • 📕 Closed Book U+1F4D5 (Unicode 6.0)
  • 📖 Open Book U+1F4D6 (Unicode 6.0)
  • 📗 Green Book U+1F4D7 (Unicode 6.0)
  • 📘 Blue Book U+1F4D8 (Unicode 6.0)
  • 📙 Orange Book U+1F4D9 (Unicode 6.0)
  • 📚 Books U+1F4DA (Unicode 6.0)
  • 📝 Memo U+1F4DD (Unicode 6.0)
    • メモ
  • 🔖 Bookmark U+1F516 (Unicode 6.0)
  • 🗒 Spiral Note Pad U+1F5D2 (Unicode 7.0)
    • メモなど
  • 📁 File Folder U+1F4C1 (Unicode 6.0)
    • フォルダ
  • 📂 Open File Folder U+1F4C2 (Unicode 6.0)
    • フォルダ
  • 🏃 Runner U+1F3C3 :runner: (Unicode 6.0)
  • 🔗 Link Symbol U+1F517 (Unicode 6.0)
    • リンク
    • Facebook では「🔗 ○○さんがリンクをシェアしました」という形で通知メールの Subject に使用している。
    • mixi日記では [m:830]
  • 📍Round Pushpin U+1F4CD (Unicode 6.0)
    • 位置、チェックインなど
    • Facebook では「📍 ○○さんが△△にチェックインしました」という形で通知メールの Subjectに使用している。
  • 👨‍💼 Man Office Worker U+1F468 U+200D U+1F4BC
    • 男性会社員
  • 👨‍💻 Man Technologist U+1F468 U+200D U+1F4BB
  • 🧑 Adult U+1F9D1 (Unicode 10.0)
  • ✏️ Pencil U+270F (Unicode 1.1) + Variation Selector-16 U+FE0F (Unicode 3.2)
メモ内容の分類
  • 💡 Electric Light Bulb U+1F4A1 :bulb: (Unicode 6.0)
  • 💬 Speech Balloon U+1F4AC :speech_balloon: (Unicode 6.0)
    • 発言
    • 辞書登録: ふきだし
  • 💭 Thought Balloon U+1F4AD :thought_balloon: (Unicode 6.0)
    • thoughts、自分が考えたこと
    • 辞書登録: しこう
予定
  • 📅 Calendar U+1F4C5 (Unicode 6.0)
    • 予定など
  • 📆 Tear-Off Calendar U+1F4C6 (Unicode 6.0)
    • 予定など
  • 🗓 Spiral Calendar Pad U+1F5D3 (Unicode 7.0)
    • 予定など

家族

  • 👨‍👩‍👧‍👧 4人家族
  • 💑 夫婦

手元の Emacs では表示されない

  • 🤔 Thinking Face U+1F914 (Unicode 8.0) (Symbola にはない?)

参考サイト

[ 1月3日全て ]

2021年2月17日 (水)

今日のさえずり: iA Writer for Mac のファイルリストでの増殖問題、Unicode 正規化形式C (NFC) が原因

  • 22:28 iA Writer for Mac のファイルリストで、選択すると表示が2つに増殖するファイルがある問題(ファイル自体が増えるわけではない)。 ファイル名に含まれている濁点・半濁点が Unicode 正規化形式C (NFC) になっている場合に発生することが分かった。
  • 22:31 同じファイルが別の MaciA Writer だと問題なかったの、 Dropbox がいい感じにファイル名変換してくれてたからっぽいな。
[ 2月17日全て ]

About Me

Naney Naney

Naney (なにい)です。株式会社ミクシィで SNS 事業の部長をしています。

About nDiki

nDiki1999年1月に始めたコンピュータ日誌を前身とする NaneyWeb 日記(兼パーソナルナレッジベース)です。

#nNote タグがついている記事は他の記事に比べて、より断片的・未整理・不完全なちょっとしたノートです。まだ結論に至っていない考えなども含まれます。頻繁/大幅に更新したり削除したりすることがあります。

※本サイトの内容は個人的見解であり所属組織とは関係ありません。

Other Notes

ナレッジベースアプリケーション Obsidian で書いているノートの一部を notes.naney.org で 公開しています。

月別インデックス
Process Time: 0.097087s / load averages: 0.30, 0.42, 0.34
nDiki by WATANABE Yoshimasa (Naney)
Powered by DiKicker