Unicode数据的hexDump

unidump的Python项目详细描述


Unicode码位转储。

该命令分析输入,然后打印三列:此行中第一个代码点的原始字节数,十六进制表示法中的代码点,最后,原始输入字符
用一个点替换控制和空白。


无效字节序列用一个“x”表示,十六进制值en-
用问号封闭,例如“?五楼?“

您可以从stdin导入数据,一次选择多个文件,甚至将所有这些输入方法混合在一起。


示例:

*stdin的基本用法:

0 0041 0042 0043 0044 abcd
4 0045 0046 0047 0048 efgh
8 0049 004a 004b 004c ijkl
12 004d 004e 004f 0050 mnop

*转储从另一种编码转换的代码点:


unidump-c latin-1一些旧文件

*同时转储许多文件:

unidump foo-*.txt

*控制字符和空白是安全的呈现:

echo-n-e'\x01'unidump-n 1
0 0001。

*最后了解您最喜欢的表情符号由哪些组成:

(echo-n-e'\xf0\x9f\x7d\xf0\x9f\x8f\xbd\xe2';\
echo-n-e'\x80\x8d\xe2\x99\x82\xef\xb8\x8f';)|\
unidump-n 5
0 1f9dd 1f3fd 200d 2642 fe0f.

有关图像,请参见http://emojipedia.org/man elf medium skin tone/>;。“elf”
emoji(第一个字符)在这里替换为一个点,因为当前版本的python的unicodedata还不知道这个字符。

*像字符串一样使用它(1):



这将用“x”替换输入文件中的每个未知字节,用“.”替换每个
控件和空白字符。

*仅打印输入的代码点:

unidump-e'{repr}'$'\n'-n 1 some file.txt

如果
通过“wc-l”管道传输,则可以使用此项计算文件中字符(而不是原始字节)的总数。


这是Unidump的1.1.2版,使用Unicode 8.0.0数据。




欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java DatePicker材质只拾取月份和年份   java如何在字符数组中存储字符数。基本上是想在数组上使用增量运算符   控制器中的java Spring自动连线不工作   java查找创建的精确soap请求和响应xml   swing在Java中使用不同的RGB值获得相同的颜色   如何组织java项目,尤其是将LIB放在哪里?   java为什么这个共享图像不适用于所有的移动设备?   图像禁用Java ImageIO色度子采样   java为什么要在Scala中扩展Serializable?   java谷歌地图:将标记保存到文本文件/其他?   java使YamlBeans忽略特定的类成员   java CommonNet FTP客户端不会给出文件列表   java将Spring引导jar部署到Azure,并使Azure重新启动   java在这个像素渲染算法中发生了什么?   java Flex将xmllistcollection对象转换为xml   java如何在jsp中删除动态表元素?我应该在控制器中写什么?   java通过rest服务在JSON中动态添加property:value   对象上的多线程同步块。java中的类?