一组处理中文文本的实用函数。
bisheng的Python项目详细描述
一组处理中文文本的实用函数。当前特征 包括:
- 在中文/日文/韩文字符和半宽字符之间添加空格 字符
- 将繁体中文转换为简体中文,然后反过来
安装
$ pip install bisheng
用法
在中文字符和半宽字符之间添加空格:
>>> import bisheng >>> print bisheng.add_spaces(u'BiSheng由Python寫成,名字源自1000多年前的活字印刷術發明人-畢昇。') BiSheng 由 Python 寫成,名字源自 1000 多年前的活字印刷術發明人 - 畢昇。
指定要排除的字符:
>>> print bisheng.add_spaces(u'中[括]弧') 中 [括] 孤 >>> print bisheng.add_spaces(u'中[括]弧', exclude='[]') 中[括]弧
繁体/简体中文转换:
>>> print bisheng.to_simp(u'畢昇') 毕升 >>> print bisheng.to_trad(u'毕升') 畢升