空间文档合并使用retokeniz

2024-07-03 06:19:43 发布

您现在位置:Python中文网/ 问答频道 /正文

我想将下面的代码转换为使用新的spacy rekonizer.。不过,我不知道该怎么做。在

>>> import spacy
>>> nlp = spacy.load("en_core_web_sm")
>>> doc = nlp("sydney is a cool town")
>>> t = doc.merge(0,6)
>>> t
sydney
>>> z = doc.merge(0,11)
>>> z
sydney is a

我尝试了以下操作,但出现了一个错误:

^{pr2}$

我想在上面的tz这样的变量中获得输出。在


Tags: 代码coreimportwebdocnlpspacyis
1条回答
网友
1楼 · 发布于 2024-07-03 06:19:43

复烤前:

print([(idx,tok) for idx,tok in enumerate(samp)])
#this prints
#[(0, sydney), (1, is), (2, a), (3, cool), (4, town)]

您可以尝试:

retokenize.merge(doc[*index_of_token_to_start_from*:*index_of_ending_token* + 1])

完整的代码

^{pr2}$

简单地合并使用,doc[3:5]

相关问题 更多 >