将汉语转换成注音或拼音

chpronounce的Python项目详细描述


Ch发音

一种使用pkuseg(一种文本分割工具)和词典将中文句子转换为注音或拼音的工具

使用

fromchpronounceimportChPronouncechp=ChPronounce()# To print out segmentation result from pkuseg, use:# chp = ChPronounce(print_seg=True)# Convert to both pinyin and zhuyinprint(chp.get_duyin("吃飽了沒?"))# Convert to zhuyinprint(chp.get_zhuyin("吃飽了"))# Convert to pinyinprint(chp.get_pinyin("我能吃玻璃而不傷身體"))print(chp.get_duyin("我睡著了"))# Output:# [('chi', 'ㄔ', 1), ('bao', 'ㄅㄠ', 3), ('le', 'ㄌㄜ', 5), ('mei', 'ㄇㄟ', 2), ('?', '?', 0)]# [('ㄔ', 1), ('ㄅㄠ', 3), ('ㄌㄜ', 5)]# [('wo', 3), ('neng', 2), ('chi', 1), ('bo', 1), ('li', 5), ('er', 2), ('bu', 4), ('shang', 1), ('shen', 1), ('ti', 3)]# [('wo', 'ㄨㄛ', 3), ('shui', 'ㄕㄨㄟ', 4), ('zhao', 'ㄓㄠ', 2), ('le', 'ㄌㄜ', 5)]

编辑词典

^{pr2}$
Toaccessormodifydictionary,use'dic'Tosave,usesave()Python3.7.7(default,Apr242020,09:08:39)[GCC9.3.0]onlinuxType"help","copyright","credits"or"license"formoreinformation.(InteractiveConsole)>>>dic[1]["好"]# Check the word "好"[(('hao','ㄏㄠ',3),'形副助叹动'),(('hao','ㄏㄠ',4),'动名')]>>>dic[1]["好"]=[(('hao','ㄏㄠ',3),'形副助叹动')]# Modify the word>>>dic[2]["你好"]# Check a phrase(['ni','hao'],['ㄋㄧ','ㄏㄠ'],[3,3])>>>dic[3]["好棒棒"]=(['hao','bang','bang'],['ㄏㄠ','ㄅㄤ','ㄅㄤ'],[3,4,4])# Create a phrase>>>save()# Write changes

Press Ctrl+D to exit the shell

字典结构:

dic├──1:(dict)├──"數":[(list)(('shu','ㄕㄨ',4),'名形'),(('shu','ㄕㄨ',3),'动副')]├──...├──2:(dict)├──"你好":(['ni','hao'],['ㄋㄧ','ㄏㄠ'],[3,3])├──...├──3:(dict)├──"計算機":(['ji','suan','ji'],['ㄐㄧ','ㄙㄨㄢ','ㄐㄧ'],[4,4,1])├──...├──4:...├──...dic=["",{"X":[(...),(...)]},{"XX":(...),"YY":(...)}]

参考文献

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
尝试运行JFLAP。戴软呢帽的罐子23。Java正在抛出异常   无引用的java数组布尔复制   hibernate如何在java SE应用程序中使用JPA EntityManager   java如何使用ORMLite在SQLite中持久化JavaFX属性?   java无法将项目部署到GAE   java:谷歌地图维基百科层   java Resultset(getter/setter类)对象在第二次执行时未删除旧值   s中的java struts2:选择列表>请求的列表键“”作为集合/数组/映射/枚举/迭代器类型   java如何在Karaf 4.0.5中获得BaseDao中的entityManager?   java VSCode未从控制台读取西里尔文   java字体。createFromAsset()返回字体的空指针异常   java错误:将Android Studio从0.6.1更新到0.8.9后,没有合适的构造函数