空间文档合并使用retokeniz

2024-07-03 06:19:43 发布

男 | 程序猿一只，喜欢编程写python代码。

我想将下面的代码转换为使用新的spacy rekonizer.。不过，我不知道该怎么做。在

>>> import spacy
>>> nlp = spacy.load("en_core_web_sm")
>>> doc = nlp("sydney is a cool town")
>>> t = doc.merge(0,6)
>>> t
sydney
>>> z = doc.merge(0,11)
>>> z
sydney is a

我尝试了以下操作，但出现了一个错误：

^{pr2}$

我想在上面的t或z这样的变量中获得输出。在

Tags：代码 core import web doc nlp spacy is

1条回答

网友

1楼 · 发布于 2024-07-03 06:19:43

复烤前：

print([(idx,tok) for idx,tok in enumerate(samp)])
#this prints
#[(0, sydney), (1, is), (2, a), (3, cool), (4, town)]

您可以尝试：

retokenize.merge(doc[*index_of_token_to_start_from*:*index_of_ending_token* + 1])

完整的代码

^{pr2}$

简单地合并使用，doc[3:5]

空间文档合并使用retokeniz

相关问题更多 >

编程相关推荐

热门问题

热门文章

空间文档合并使用retokeniz

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >