中文文本处理中的识别与转换功能

dragonmapper的Python项目详细描述


https://badge.fury.io/py/dragonmapper.pnghttps://travis-ci.org/tsroten/dragonmapper.png?branch=develop

Dragon Mapper是一个提供标识和转换的Python库 中文文本处理功能。

功能

  • 汉字、拼音、注音与国际的转换 拼音字母表。
  • 将字符串标识为繁体或简体中文、拼音、注音或 国际音标
>>>s='我是一个美国人。'>>>dragonmapper.hanzi.is_simplified(s)True>>>dragonmapper.hanzi.to_pinyin(s)'wǒshìyīgèměiguórén。'>>>dragonmapper.hanzi.to_pinyin(s,all_readings=True)'[wǒ][shì/shi/tí][yī][gè/ge/gě/gàn][měi][guó][rén/ren]。'
>>>s='Wǒ shì yīgè měiguórén.'>>>dragonmapper.transcriptions.is_pinyin(s)True>>>dragonmapper.transcriptions.pinyin_to_zhuyin(s)'ㄨㄛˇ ㄕˋ ㄧ ㄍㄜˋ ㄇㄟˇ ㄍㄨㄛˊ ㄖㄣˊ.'>>>dragonmapper.transcriptions.pinyin_to_ipa(s)'wɔ˧˩˧ ʂɨ˥˩ i˥ kɤ˥˩ meɪ˧˩˧ kwɔ˧˥ ʐən˧˥.'

开始

更改日志

0.2.6(2016-05-23)

  • 修正了女的读数。修复10。
  • 为python 2用户添加关于unicode字符串的注释。
  • 颠簸需要Hanzidentifier版本。
  • 把元音变音符固定在“L”辅音上。修复14。

0.2.5(2015-08-06)

  • 修复9。在setup.py中使用io.open()和utf-8编码。

0.2.4(2015-04-08)

  • 修复8。将re.unicode添加到转录转换。
  • 修复某些字符的错误格式读数。
  • 修复7.修复了“ou”元音组合的不正确unihan数据库读数。

0.2.3(2014-04-28)

  • 修复6.将-r后缀音节添加到转录映射数据中。

0.2.2(2014-04-28)

  • 修复了与5相关的大写错误。

0.2.1(2014-04-28)

  • 重新格式化README.rst
  • 将更改日志文件重命名为*.rst
  • 添加作者和参与文件。
  • 设置Travis CI。
  • 将版本添加到__init__.py
  • 修复5。使accented_to_numbered()在需要时添加撇号。
  • 修复4.修复了numbered_to_accented()'v'元音的处理。
  • 修复3.将IndexError异常处理程序更改为KeyError
  • 修复2.用大写重音元音修复accented_to_numbered()

0.2.0(2014-04-14)

  • 修复拼音错误。
  • adds is_pinyin_compatible()和is_zhuyin_compatible()函数。
  • 删除用于标识汉字的代码并合并汉字标识符库。
  • 删除sphinx viewcode扩展名。
  • 将Python3.4环境添加到TOX配置。
  • 修复setup.py中的拼写错误。修复1.

0.1.0(2014-02-17)

  • 初次发布。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
WebLogic10.3JAR包含Weblogic的java。马绍尔群岛共和国。远程异常   JavaHibernate不更新或删除,但插入   java检查字段是否被覆盖   java程序只发送一次消息   使用DefaultDesktopManager对JInternalFrame进行图标化时出现java异常   如何在firebase数据库安卓 studio/java中检索特定子级的数据?   java JsonIllegalstateexception:应为BEGIN_数组,但在第1行第61列为字符串。$顾客数据   javascript在使用Angular JS调用HTML文件中的函数时遇到问题   在Java中填充多维数组   java selenium webdriverXpath不适用于列表   在不同bean上运行事务的java抛出异常   java我可以知道backoffice用户是否忘记保存其更改吗?   数学算术运算   java如何格式化和比较来自bash/vm的输入?   关闭JDBC连接时出现java问题   java错误:无法解析MyFirstApp教程中的符号“edit_message”   java将/n替换为带返回码的真正utf8