与Spacy的Excel集成。包括,实体训练,实体匹配管道。

excelc的Python项目详细描述


卓越是强大的

简单风格的培训 ,来自Spacy文档,演示如何使用Spacy来培训NER:

TRAIN_DATA=[("Uber blew through $1 million a week",{'entities':[(0,4,'ORG')]}),("Google rebrands its business apps",{'entities':[(0,6,"ORG")]})]nlp=spacy.blank('en')optimizer=nlp.begin_training()foriinrange(20):random.shuffle(TRAIN_DATA)fortext,annotationsinTRAIN_DATA:nlp.update([text],[annotations],sgd=optimizer)nlp.to_disk('/model')

训练数据描述要训练的句子和带注释的实体。总是数字符是很麻烦的。使用excelcy,可以省略(开始、结束)字符。

# download the en model from spacy# python -m spacy download en"fromexcelcyimportExcelCy# collect sentences, annotate Entities and train NER using spaCyexcelcy=ExcelCy.execute(file_path='https://github.com/kororo/excelcy/raw/master/tests/data/test_data_01.xlsx')# use the nlp object as per spaCy APIdoc=excelcy.nlp('Google rebrands its business apps')# or save_storage it for faster bootstrap for applicationexcelcy.nlp.to_disk('/model')

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java附加两个数组   java如何在Extjs的不同页面中使用相同的存储   java Jung,大顶点的布局重叠,图形出现在奇怪的位置   java如何在Android中通过画布绘制圆?   java验证库设计模式选择   java研磨机未知标记“timedTests”   java Android领域子类实例方法   java使用resteasy/jaxrs从请求负载接收两种类型的数据   缓冲策略Java缓冲策略有时不能正确绘制   java跟踪棋子   密度无关像素如何在java中锐化图像缩略图?   java如何在MongoDB更新查询中编写(或)更新   java A*寻路游戏系统退出问题   java在安卓中读取xml的最佳方式是什么?   通过反射调用的方法的java抑制警告   安卓 java。语言错误:信号11(SIGSEGV),代码10(?),故障地址006e006f   java lombok 1.18.2使用DexBuilderForDebug抛出TransformClasses   java JOptionPane CD对话框按钮?   java只返回json中的一些值,而不是完整实体对象   java包不存在错误,请稍后重试