如何生成最有可能占据给定句子中缺失标记位置的标记列表
我发现这个StackOverflow answer,但是,它只生成一个可能的单词,而不是一个适合这个句子的单词列表。我试着打印出每一个变量,看看他是否能生成所有可能的单词,但没有运气
比如说,
>>> sentence = 'Cristiano Ronaldo dos Santos Aveiro GOIH ComM is a Portuguese professional [].' # [] is missing word
>>> generate(sentence)
['soccer', 'basketball', 'tennis', 'rugby']
我刚刚在model hub of HuggingFace上用BERT base uncased模型试用了您的示例,它生成了一个可能的令牌列表:
我可以写一个Colab笔记本来解释如何编写代码。每个神经网络总是输出一个概率分布,因此您可以以最高的概率返回令牌
基本上,您可以执行与this answer中相同的操作,但不只是添加最佳拟合标记,而是以五个最拟合标记为例:
对于您的句子,这将导致:
[['footballer', 'golfer', 'football', 'cyclist', 'boxer']]
相关问题 更多 >
编程相关推荐