バイト列の後ろから、UTF-8 でエンコードされた1文字を取り出すの面倒かなと思ったら簡単だった。
後続バイトは必ず 10xxxxxx であるので、後ろからスキャンしてそれ以外 (0xxxxxxx または 11xxxxxx) がきたらそれが最後の文字の最初のバイト。
よくできている。
Naney (なにい)です。株式会社ミクシィで SNS 事業の部長をしています。
nDiki は1999年1月に始めたコンピュータ日誌を前身とする Naney の Web 日記(兼パーソナルナレッジベース)です。ちょっとしたノートは nNote にあります。
※内容は個人的見解であり所属組織とは関係ありません。
Follow @Naney