文字からUTF-8のバイトコードを調べるワンライナー
環境
文字からUTF-8のバイトコードを調べるワンライナー
ー
(全角ハイフン)を調べたい場合
$ echo -n 'ー' | iconv -f utf-8 | xxd -p e383bc
-t
を明示しない場合はUTF-8で出力と解釈される
ワンライナーの意味
- 下記を参照
出力するエンコーディング方式を指定する
-
xxd
はファイルのダンプなのでUTF-16BEのBOMfeff
も付与されている模様(30fc
がー
のバイトコード)
$ echo -n 'ー' | iconv -f utf-8 -t utf-16 | xxd -p feff30fc
$ echo -n 'ー' | iconv -f utf-8 -t sjis | xxd -p 815b
他の方法は
- あるかもしれないです