用于处理越南语文本的函数

viet-text-tools的Python项目详细描述


用于处理越南语文本的函数

安装

从PyPi获得最新的稳定版本

pip install viet_text_tools

使用

规范化音调符号()

您可以规范化越南语单词的发音符号。返回值采用组合(NFC)形式

^{pr2}$

传递new_style=True以使用新样式音调放置

normalize_diacritics('thủy',new_style=True)=='thuỷ'

传递decomposed=True,以返回分解(NFD)形式的字符串

len(normalize_diacritics('thủy'))==4len(normalize_diacritics('thủy',decomposed=True))==5

越南语\u sort_key()

与sorted()一起使用的键函数,以正确的排序顺序对越南语文本进行排序

words=['anh','ba','áo','cắt','cá','cả']sorted(words)==['anh','ba','cá','cả','cắt','áo']sorted(words,key=vietnamese_sort_key)==['anh','áo','ba','cả','cá','cắt']

越南语\u不区分大小写\u sort_key()

越南语\u sort_key()相同,但不区分大小写。在

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java我需要使用最小值1 while&for循环显示范围内的素数。并且得到了错误的输出   java报告Junit xml文件   socketJava FTP上载   重新启动SpringBatch时的java通知   java无法使用@Query更新spring数据jpa中的记录   javax与javax的区别。ejb。会话同步和javax。交易同步   SQL查询在TOAD中运行良好,但在java代码中则不行   java私有静态最终字符串未完成其工作   使用forName()动态调用类时java ClassNotFoundException   初始化SparkConf MLLIB时发生java非法访问错误   java JAR文件在Windows上运行,但在Linux上不运行   java JPA和spring处理带有异常和泛型的DAO   java缓存在Spring引导中未得到更新   正则表达式Java匹配器类优先级   java文件。delete()不起作用   java如何为安卓项目生成不同分辨率的图像?   java添加从my RecycleView中选择的项目   java以元素频率顺序遍历多集的最简单方法?   java将JDK路径从WSL2 Ubuntu添加到IntelliJ IDE冻结了屏幕