恢复文本大写的库

truecase的Python项目详细描述


TrueCase

独立于语言的统计语言模型 基于python的工具,用于恢复文本的大小写信息。

模型的灵感来源于Lucian Vlad Lita et al., tRuEcasIng的论文,但有一些简化。

在NLTK英语语料库上训练的模型默认带有这个包, 对于其他语言,会提供一个脚本来创建模型。这个模型是 不完美,在一个大的和最新的数据集上训练系统以实现 最好的结果(比如最近维基百科上的一篇文章)。

先决条件

Python3

该项目使用nltk。查找安装说明here

安装

pip install truecase

用法

简单用例:

>>> import truecase
>>> truecase.get_true_case('hey, what is the weather in new york?')
'Hey, what is the weather in New York?''

培训自己的车型

托多。现在请参考trainer.py

贡献

我看到了很大的改进空间。请随意叉叉和改进。发送一个请求。

作者

许可证

这个项目是在麻省理工学院的许可下授权的-请参见LICENSE.md文件了解详细信息

致谢

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
数组Java For Loop没有输出(我认为)它应该如何输出   java Maven可以在一个模块中打包两个jar,使用相同的文件名但不同的图表集吗?   java OData读取单个实体最佳实践   java为什么我的代码在以下条件下返回false?   java QueryDsl投影元素集合   在为Java Swing元素实现ActionListener时,如何解决静态引用错误?   libGDX设置允许我使用java8,它在Android中崩溃   如何将日期从shell脚本传递到java即时数据类型   java如何向JList添加复选框和图像   java如何编写这个Listview?   java Eclipse每项目构建设置   java如何将spring引导应用程序指向外部jar的logback。xml   java更改EditText的下划线/样式。。。。。不是链接,而是水平滚动文本   java JPQL:使用复合键建模具有多个关系的查询实体   javascript如何获取Java中的最后32个字节   sql检查Java Derby中是否存在架构   java如何从视图中获取MVC Spring控制器中jstl select的所有项   java gson在需要对象时遇到空数组问题