乌尔都语自然语言处理(NLP)库。
urduhack的Python项目详细描述
乌尔都语:乌尔都语的nlp库
功能支持
- [X]标准化
- [X]阿拉伯语和乌尔都语Unicode冗余问题
- [X]字符规范化
- [X]组合字符规范化
- [X]音调符号删除
- [X]数字前后空格
- 标点后的空格
- [X]连接词修复
- []标记化
- [X]句子标记化
- []单词标记化
路线图
- []分类
- []情感分析
- []句子分类
- []文件分类
- []名称实体识别
- []图像到文本
- []与文本对话
安装
urduhack正式支持python 3.6-3.7,在pypy上运行良好。
要安装请求,只需使用pip
$ pip install urduhack
文档
精彩的文档可在https://urduhack.readthedocs.io/
如何贡献
- 检查未解决的问题或打开新问题以开始讨论 围绕一个功能想法或一个bug。有一个Contributor Friendly 为那些不太适合 熟悉代码库。
- 编写一个测试,显示错误已被修复或功能 按预期工作。
- 发送一个pull请求并对维护程序进行bug操作,直到它被合并并 出版。:)
贡献者
特别感谢所有帮助乌尔都哈克回到现在状态的人。
支持者
感谢我们所有的支持者![Become a backer]
赞助商
通过成为赞助人来支持这个项目。您的徽标将显示在这里,并带有指向您网站的链接。[Become a sponsor]
版权和许可
在MIT License下发布的代码。