Unicode数据的hexDump
unidump的Python项目详细描述
Unicode码位转储。
该命令分析输入,然后打印三列:此行中第一个代码点的原始字节数,十六进制表示法中的代码点,最后,原始输入字符
用一个点替换控制和空白。
无效字节序列用一个“x”表示,十六进制值en-
用问号封闭,例如“?五楼?“
您可以从stdin导入数据,一次选择多个文件,甚至将所有这些输入方法混合在一起。
示例:
*stdin的基本用法:
0 0041 0042 0043 0044 abcd
4 0045 0046 0047 0048 efgh
8 0049 004a 004b 004c ijkl
12 004d 004e 004f 0050 mnop
*转储从另一种编码转换的代码点:
unidump-c latin-1一些旧文件
*同时转储许多文件:
unidump foo-*.txt
*控制字符和空白是安全的呈现:
echo-n-e'\x01'unidump-n 1
0 0001。
*最后了解您最喜欢的表情符号由哪些组成:
(echo-n-e'\xf0\x9f\x7d\xf0\x9f\x8f\xbd\xe2';\
echo-n-e'\x80\x8d\xe2\x99\x82\xef\xb8\x8f';)|\
unidump-n 5
0 1f9dd 1f3fd 200d 2642 fe0f.
有关图像,请参见http://emojipedia.org/man elf medium skin tone/>;。“elf”
emoji(第一个字符)在这里替换为一个点,因为当前版本的python的unicodedata还不知道这个字符。
*像字符串一样使用它(1):
这将用“x”替换输入文件中的每个未知字节,用“.”替换每个
控件和空白字符。
*仅打印输入的代码点:
unidump-e'{repr}'$'\n'-n 1 some file.txt
如果
通过“wc-l”管道传输,则可以使用此项计算文件中字符(而不是原始字节)的总数。
这是Unidump的1.1.2版,使用Unicode 8.0.0数据。
该命令分析输入,然后打印三列:此行中第一个代码点的原始字节数,十六进制表示法中的代码点,最后,原始输入字符
用一个点替换控制和空白。
无效字节序列用一个“x”表示,十六进制值en-
用问号封闭,例如“?五楼?“
您可以从stdin导入数据,一次选择多个文件,甚至将所有这些输入方法混合在一起。
示例:
*stdin的基本用法:
4 0045 0046 0047 0048 efgh
8 0049 004a 004b 004c ijkl
12 004d 004e 004f 0050 mnop
*转储从另一种编码转换的代码点:
unidump-c latin-1一些旧文件
*同时转储许多文件:
unidump foo-*.txt
*控制字符和空白是安全的呈现:
echo-n-e'\x01'unidump-n 1
0 0001。
*最后了解您最喜欢的表情符号由哪些组成:
(echo-n-e'\xf0\x9f\x7d\xf0\x9f\x8f\xbd\xe2';\
echo-n-e'\x80\x8d\xe2\x99\x82\xef\xb8\x8f';)|\
unidump-n 5
0 1f9dd 1f3fd 200d 2642 fe0f.
有关图像,请参见http://emojipedia.org/man elf medium skin tone/>;。“elf”
emoji(第一个字符)在这里替换为一个点,因为当前版本的python的unicodedata还不知道这个字符。
*像字符串一样使用它(1):
这将用“x”替换输入文件中的每个未知字节,用“.”替换每个
控件和空白字符。
*仅打印输入的代码点:
unidump-e'{repr}'$'\n'-n 1 some file.txt
如果
通过“wc-l”管道传输,则可以使用此项计算文件中字符(而不是原始字节)的总数。
这是Unidump的1.1.2版,使用Unicode 8.0.0数据。