中文文本处理中的识别与转换功能
dragonmapper的Python项目详细描述
Dragon Mapper是一个提供标识和转换的Python库 中文文本处理功能。
- 文档:http://dragonmapper.rtfd.org
- Github:https://github.com/tsroten/dragonmapper
- 自由软件:麻省理工学院许可证
功能
- 汉字、拼音、注音与国际的转换 拼音字母表。
- 将字符串标识为繁体或简体中文、拼音、注音或 国际音标
>>>s='我是一个美国人。'>>>dragonmapper.hanzi.is_simplified(s)True>>>dragonmapper.hanzi.to_pinyin(s)'wǒshìyīgèměiguórén。'>>>dragonmapper.hanzi.to_pinyin(s,all_readings=True)'[wǒ][shì/shi/tí][yī][gè/ge/gě/gàn][měi][guó][rén/ren]。'
>>>s='Wǒ shì yīgè měiguórén.'>>>dragonmapper.transcriptions.is_pinyin(s)True>>>dragonmapper.transcriptions.pinyin_to_zhuyin(s)'ㄨㄛˇ ㄕˋ ㄧ ㄍㄜˋ ㄇㄟˇ ㄍㄨㄛˊ ㄖㄣˊ.'>>>dragonmapper.transcriptions.pinyin_to_ipa(s)'wɔ˧˩˧ ʂɨ˥˩ i˥ kɤ˥˩ meɪ˧˩˧ kwɔ˧˥ ʐən˧˥.'
开始
- Install Dragon Mapper
- 阅读Dragon Mapper’s tutorial
- 通过GitHub Issues报告错误并提出问题
- 如果需要更多技术信息,请参阅API documentation。
- Contribute文档、代码或反馈
更改日志
0.2.6(2016-05-23)
- 修正了女的读数。修复10。
- 为python 2用户添加关于unicode字符串的注释。
- 颠簸需要Hanzidentifier版本。
- 把元音变音符固定在“L”辅音上。修复14。
0.2.5(2015-08-06)
- 修复9。在setup.py中使用io.open()和utf-8编码。
0.2.4(2015-04-08)
- 修复8。将re.unicode添加到转录转换。
- 修复某些字符的错误格式读数。
- 修复7.修复了“ou”元音组合的不正确unihan数据库读数。
0.2.3(2014-04-28)
- 修复6.将-r后缀音节添加到转录映射数据中。
0.2.2(2014-04-28)
- 修复了与5相关的大写错误。
0.2.1(2014-04-28)
- 重新格式化README.rst。
- 将更改日志文件重命名为*.rst。
- 添加作者和参与文件。
- 设置Travis CI。
- 将版本添加到__init__.py。
- 修复5。使accented_to_numbered()在需要时添加撇号。
- 修复4.修复了numbered_to_accented()对'v'元音的处理。
- 修复3.将IndexError异常处理程序更改为KeyError。
- 修复2.用大写重音元音修复accented_to_numbered()。
0.2.0(2014-04-14)
- 修复拼音错误。
- adds is_pinyin_compatible()和is_zhuyin_compatible()函数。
- 删除用于标识汉字的代码并合并汉字标识符库。
- 删除sphinx viewcode扩展名。
- 将Python3.4环境添加到TOX配置。
- 修复setup.py中的拼写错误。修复1.
0.1.0(2014-02-17)
- 初次发布。