Python spacy-stanfordnlp包_程序模块 - PyPI

在Spacy中直接使用最新的StanfordNLP研究模型

spacy-stanfordnlp的Python项目详细描述

Spacy+Stanfordnlp

这个包包装StanfordNLP 图书馆，所以你可以用斯坦福的模型作为spaCy 管道。斯坦福模型在2017年和2018年的Conll中达到了最高的精确度共享任务，包括标记化、词性标记、形态学 58种语言中的分析、引理化和标记依赖分析。

使用这个包装器，您将能够使用以下注释，由您的预培训stanfordnlp模型：

统计标记化（反映在Doc及其标记中）
金属化（token.lemma和token.lemma_）
词性标注（token.tag，token.tag_，token.pos，token.pos_）
依赖分析（token.dep，token.dep_，token.head）
句子分段（doc.sents）

__安装

pip install spacy-stanfordnlp

确保同时安装 pre-trained StanfordNLP models。建议在python 3.6.8+或python3.7.2+上运行stanfordnlp。

用法和示例

可以用加载的stanfordnlp初始化StanfordNLPLanguage类管道并返回间隔^{} object，即，可以用来处理文本和创建 ^{} object。

importstanfordnlpfromspacy_stanfordnlpimportStanfordNLPLanguagesnlp=stanfordnlp.Pipeline(lang="en")nlp=StanfordNLPLanguage(snlp)doc=nlp("Barack Obama was born in Hawaii. He was elected president in 2008.")fortokenindoc:print(token.text,token.lemma_,token.pos_,token.dep_)

如果给定语言的语言数据在SPAcy中可用，则语言类将用作nlp对象的基-例如， English()。这允许使用SPACY的词汇属性，如^ {< CD19> }或 like_num。nlp对象与任何其他SPAcy遵循相同的API Language 类-这样您就可以不愉快地可视化对象，添加自定义组件到管道，使用基于规则的匹配器你平时做的任何事。

# Access spaCy's lexical attributesprint([token.is_stopfortokenindoc])print([token.like_numfortokenindoc])# Visualize dependenciesfromspacyimportdisplacydisplacy.serve(doc)# or displacy.render if you're in a Jupyter notebook# Efficient processing with nlp.pipefordocinnlp.pipe(["Lots of texts","Even more texts","..."]):print(doc.text)# Combine with your own custom pipeline componentsdefcustom_component(doc):# Do something to the doc herereturndocnlp.add_pipe(custom_component)# Serialize it to a numpy arraynp_array=doc.to_array(['ORTH','LEMMA','POS'])

< H3>实验：管道组件的混合匹配< EH3>

默认情况下，nlp对象的管道将为空，因为所有属性计算一次并在自定义中设置 ^{}。但是因为它是一个规则的nlp 对象，可以将自己的组件添加到管道中。

例如，spacy的一个预训练模型中的实体识别器：

importspacyimportspacy_stanfordnlpimportstanfordnlpsnlp=stanfordnlp.Pipeline(lang="en",models_dir="./models")nlp=StanfordNLPLanguage(snlp)# Load spaCy's pre-trained en_core_web_sm model, get the entity recognizer and# add it to the StanfordNLP model's pipelinespacy_model=spacy.load("en_core_web_sm")ner=spacy_model.get_pipe("ner")nlp.add_pipe(ner)doc=nlp("Barack Obama was born in Hawaii. He was elected president in 2008.")print([(ent.text,ent.label_)forentindoc.ents])# [('Barack Obama', 'PERSON'), ('Hawaii', 'GPE'), ('2008', 'DATE')]

你也可以添加和训练 your own custom text classification component。

高级：序列化和入口点

由StanfordNLPLanguage创建的spacynlp对象将其语言公开为 stanfordnlp_xx。

fromspacy.utilimportget_lang_classlang_cls=get_lang_class("stanfordnlp_en")

正常情况下，上述操作会失败，因为spacy不包含语言类 stanfordnlp_en。但是因为这个包公开了一个spacy_languages条目指向其^{}中指向StanfordNLPLanguage的空格知道如何初始化它。

这意味着保存到磁盘和从磁盘加载可以工作：

snlp=stanfordnlp.Pipeline(lang="en")nlp=StanfordNLPLanguage(snlp)nlp.to_disk("./stanfordnlp-spacy-model")

spacy.load上的其他参数将自动传递给语言类和管道组件。所以当加载保存的模型时，您可以传入snlp参数：

snlp=stanfordnlp.Pipeline(lang="en")nlp=spacy.load("./stanfordnlp-spacy-model",snlp=snlp)

注意，默认情况下不会保存任何模型数据。斯坦福德国家公园模型非常大，所以现在，这个包希望您加载它们另外。

欢迎加入QQ群-->： 979659372

推荐PyPI第三方库

导航栏
项目描述
版本历史
项目链接
首页
标签
许可证: BSD许可证（BSD 3条款）
作者信息:: 暂无
维护者
inesmontani
最新PyPI项目
italian_vip_says
UFx
vofs
fake_item_generator
NerEva
django-monologue
fio_product_attribute_strict
climailsystem
pyshape
tbb-devel
npy-append-arra
anthill.tal.macrorenderer
odoo11-addon-stock-a
uuuu
contextil
fyl_nester
appomatic_renderable
teacher
chuletas
slackbot_ce
最新Python常见问题
如何提高Djang的410误差
如何提高doc2vec模型中两个文档（句子）的余弦相似度？
如何提高Docker的日志限制？|[输出已剪裁，达到日志限制100KiB/s]
如何提高DQN的性能？
如何提高EasyOCR的准确性/预测？
如何提高Euler#39项目解决方案的效率？
如何提高F1成绩进行分类
如何提高FaceNet的准确性
如何提高fft处理的精度？
如何提高Fibonacci实现对大n的精度？
如何提高Flask与psycopg2的连接时间
如何提高FosterCauer变换的scipy.signal.invres（）的数值稳定性？
如何提高gae查询的性能？
如何提高GANs用于时间序列预测/异常检测的结果
如何提高gevent和tornado组合的性能？

spacy-stanfordnlp 0.1.3

spacy-stanfordnlp的Python项目详细描述

Spacy+Stanfordnlp

__安装

用法和示例

高级：序列化和入口点

推荐PyPI第三方库

gdaps-frontend-vue

odoo13-addon-hr-attendance-reason

pyThingPark

varsom-landslide-client

sitefab

django-polls-su

mishkal

django-dbml

adaptive-learning

wikivents

text-classification-prova-alessandro-artoni

django-valerie

neptune-resolver-rest

simple-arcgis-wrapper

double-click

导航栏

项目链接

标签

维护者

最新PyPI项目

最新Python常见问题

spacy-stanfordnlp 0.1.3

spacy-stanfordnlp的Python项目详细描述

Spacy+Stanfordnlp

__安装

用法和示例

高级：序列化和入口点

推荐PyPI第三方库

gdaps-frontend-vue

odoo13-addon-hr-attendance-reason

pyThingPark

varsom-landslide-client

sitefab

django-polls-su

mishkal

django-dbml

adaptive-learning

wikivents

text-classification-prova-alessandro-artoni

django-valerie

neptune-resolver-rest

simple-arcgis-wrapper

double-click

导 航 栏

项目 链接

标 签

维护者

最新PyPI项目

最新Python常见问题

导航栏

项目链接

标签