用于处理越南语文本的函数
viet-text-tools的Python项目详细描述
用于处理越南语文本的函数
安装
从PyPi获得最新的稳定版本
pip install viet_text_tools
使用
规范化音调符号()
您可以规范化越南语单词的发音符号。返回值采用组合(NFC)形式
^{pr2}$传递new_style=True以使用新样式音调放置
normalize_diacritics('thủy',new_style=True)=='thuỷ'
传递decomposed=True,以返回分解(NFD)形式的字符串
len(normalize_diacritics('thủy'))==4len(normalize_diacritics('thủy',decomposed=True))==5
越南语\u sort_key()
与sorted()一起使用的键函数,以正确的排序顺序对越南语文本进行排序
words=['anh','ba','áo','cắt','cá','cả']sorted(words)==['anh','ba','cá','cả','cắt','áo']sorted(words,key=vietnamese_sort_key)==['anh','áo','ba','cả','cá','cắt']
越南语\u不区分大小写\u sort_key()
与越南语\u sort_key()相同,但不区分大小写。在
- 项目
标签: