训练定制瑞典斯帕西mod

2024-06-28 19:05:21 发布

您现在位置:Python中文网/ 问答频道 /正文

我的目的是为瑞典语培训一个spaCy自定义POS标记器和依赖性解析器。 我按照https://spacy.io/usage/training上的说明,对模型进行了瑞典Talbanken treebank conllu文件的培训。 这些步骤进行得很顺利,我最终得到了一个定制模型。然后我加载了模型并尝试了一个小例子:

nlp = spacy.load(name=os.path.join(spacy_path, 'models/model-best'))
doc = nlp(u'Jag heter Alex Nilsson. Hon heter Lina')
# My name is Alex Nilsson. Her name is Lina

for token in doc:
    print(token.text, token.pos_, token.dep_)

# OUTPUT:

#Jag PRON nsubj
#heter VERB ROOT
#Alex PROPN obj
#Nilsson PROPN flat:name
#. PUNCT punct
#Hon PRON nsubj
#heter VERB parataxis
#Lina PROPN obj

POS标记器和依赖关系解析器似乎都可以工作。不起作用的是句子分割和名词块。在

^{pr2}$

所以,不分割句子,也不输出名词块。据我所知,spaCy对这两个功能都使用依赖性解析器。但是如上所示,依赖性解析器应该可以正常工作。这两个人还需要什么吗?也许我错过了一些显而易见的东西?在

我很感谢你的帮助!在


Tags: name标记pos模型token解析器nlpspacy
1条回答
网友
1楼 · 发布于 2024-06-28 19:05:21

不太确定,但我认为量刑是有效的,因为S.SENTDOC公司不是空的。只是看起来效果不好。我会尝试分析一个较大的文本(但仍然很小),并可能使用较长的句子。由于量刑者通过寻找依赖标记来构建句子,较长的句子不太可能合并成一个单独的句子。在

至于名词块,我的理解(来自documentation)是语言必须有一个在语法中定义的名词chunks方法_迭代器.py语言数据的文件。它似乎不是自动训练的。在

相关问题 更多 >