空间中引理查找表的扩展

import spacy nlp = spacy.load('de') Spacy_lookup = spacy.lang.de.LOOKUP New_lookup = {'AAA':'Anonyme Affen Allianz','BBB':'Berliner Bauern Bund','CCC':'Chaos Chaoten Club'} Spacy_lookup.update(New_lookup) spacy.lang.de.LOOKUP = Spacy_lookup tagged = nlp("Die AAA besiegt die BBB und den CCC unverdient.") [ print(each.lemma_) for each in tagged] Die Anonyme Affen Allianz besiegen der Berliner Bauern Bund und der Chaos Chaoten Club unverdient .

1条回答

网友

1楼 · 发布于 2024-09-30 01:33:45

你的解决方案似乎不错。在

但是，我更清洁的解决方法是利用自定义空间管道特性。具体来说，如果令牌在doc中，您可以创建一个新组件来更新lemma属性，然后将其堆栈在管道中。在

示例代码：

import spacy
custom_lookup = {'AAA':'Anonyme Affen Allianz','BBB':'Berliner Bauern Bund','CCC':'Chaos Chaoten Club'}

def change_lemma_property(doc):
    for token in doc:
        if (token.text in custom_lookup):
            token.lemma_ = custom_lookup[token.text]
    return doc

nlp = spacy.load('de')
nlp.add_pipe(change_lemma_property, first=True)
text = 'Die AAA besiegt die BBB und den CCC unverdient.'
doc = nlp(text)
[print(x.lemma_) for x in doc]

相关问题更多 >

编程相关推荐

热门问题

热门文章