重新连接,调试带注释的命名实体识别(NER)数据的不一致性,并获得有关提高数据质量的见解。
reconner的Python项目详细描述
文档:https://kabirkhan.github.io/recon
源代码:https://github.com/kabirkhan/recon
ReconNER是一个库,它可以帮助您修复带注释的NER数据,并确定模型最难预测的示例,以便您可以战略性地对注释的示例进行优先级排序。在
主要特点是:
- Data Validation and Cleanup:轻松验证NER数据的格式。过滤重叠的实体注释,修复丢失的属性。在
- Model Insights:分析模型在数据集中的表现。找出你的模型所犯的最大错误,这样你就可以从战略上优先考虑数据收集和纠正。在
- Model Insights:分析模型在数据集中的表现。找出你的模型所犯的最大错误,这样你就可以从战略上优先考虑数据收集和纠正。在
- Dataset Management:ReconNER提供了一个
Dataset
类来管理数据的train/dev/test拆分,并在数据中的所有拆分上应用相同的函数+所有示例的串联。就地操作以一致地转换数据。在 - Serializable Dataset:在JSON和ReconNER类型系统之间序列化和反序列化数据。在
- Type Hints:基于python3.6+类型提示的综合类型系统
要求
Python 3.6+
ReconNER
是建立在一些全面的、高性能的包上的。在
- 空间
- Pydantic(类型系统和JSON序列化)
- 类型(CLI)。在
安装
$ pip install reconner ---> 100%Successfully installed reconner
许可证
这个项目是根据麻省理工学院的许可条款授权的。在
- 项目
标签: