nDiki

2004年6月13日 (日)

UTF-8 でエンコードされた文字列の最後の文字

バイト列の後ろから、UTF-8 でエンコードされた1文字を取り出すの面倒かなと思ったら簡単だった。

後続バイトは必ず 10xxxxxx であるので、後ろからスキャンしてそれ以外 (0xxxxxxx または 11xxxxxx) がきたらそれが最後の文字の最初のバイト。

よくできている。

スポンサード リンク
[ 6月13日全て ]

About Me

Naney Naney (なにい)です。株式会社ミクシィで SNS 事業の部長をしています。

nDiki1999年1月に始めたコンピュータ日誌を前身とする NaneyWeb 日記(兼パーソナルナレッジベース)です。ちょっとしたノートは nNote にあります。

※内容は個人的見解であり所属組織とは関係ありません。

月別インデックス
Process Time: 0.06212s / load averages: 0.96, 0.99, 1.02
nDiki by WATANABE Yoshimasa (Naney)
Powered by DiKicker