访问Unicode字符数据库(UCD)

tangled-up-in-unicode的Python项目详细描述


纠结于Unicode

此模块提供从Unicode字符数据库(UCD)访问所有Unicode字符的字符属性。 这个模块提供了Python标准库^{}的替代方案。 Tangled up in Unicode与标准库相比有四个主要优点:

  • 使用Unicode数据库的latest version。在
  • 添加人类可读的类名(属性值别名)。在
  • 扩展属性以使用数据库的更多潜力。在
  • UCD版本独立于Python版本(python3.6有ucd9.0,3.7有ucd11.0.0,3.8有12.0.1)

注意python3添加了unicode支持,但这与UCD不同。 Unicode支持处理存储和操作Unicode字符,而此包旨在提供特定字符的属性。在

示例

unicodedata中对$的默认查找:

PropertyValue
NameDollar Sign
Category (Short)Sc
Bidirectional (Short)ET
Combining0
Mirrored0
East Asian Width (Short)Na
Decomposition

此软件包提供的额外信息

^{tb2}$

性能比较

Property^{}^{}
Name
Decimal
Digit
Numeric
Combining☑ + alias
Mirrored
Decomposition
Category☑ + alias
Bidirectional☑ + alias
East Asian Width☑ + alias
Script☑ + alias-
Block☑ + alias-
Age☑ + alias-
Binary Property Values-
Version13.0.0 (latest)12.0.1

表1:属性的存在用☑ (Unicode字符“带支票的投票箱”(U+2611))。

使用

importtangled_up_in_unicodeasunicodedata

该软件包可通过pip安装:

^{pr2}$

性能

该模块是用Python编写的。 它可以用Cython编译以获得本机库的competitive performance。在

不支持的功能

unicodedata中的某些功能不受支持。在

Feature^{}^{}
lookup-
normalize-
ucd_3_2_0-

致谢

在可能的情况下,使用原始模块的代码和文档。 这个存储库是Dylan分析项目的一部分。在

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java如何在log4j中禁用调试?   java高级数据库修改“脚本”怎么办   java使JSlider thumb在单击track时出现   java中的数组几何布朗运动   java netty重试连接客户端将冻结   用户界面如何在Java中设置JButton的背景色?   java远程访问ejabberd   java是同步eclipse开发人员环境和集成环境的最佳方法?   Java中带有任意返回类型和Jackson序列化程序的json泛型方法   java ViewPager片段目标获取活动片段上下文   java一次从JavaFX TableView中删除多行的问题   将ArrayList对象分配给实例变量java   将参数从http头检索到java   java如何使用netbeans使用数据库语句计数   java如何在倒计时内更改txtcolor   java如何在Eclipse中查找不在工作区中的文件中的文本?