使用NLTK,当给定某个单词时,如何生成不同形式的单词?

2024-09-27 22:23:10 发布

您现在位置:Python中文网/ 问答频道 /正文

例如,假设有“幸福”这个词,我想产生其他形式的幸福,比如幸福,幸福。。。等等

我已经读过一些关于Stackoverflow和NLTK参考文献的其他问题。然而,只有词性标注、词形标注,就像识别句子中某些单词的语法形式一样,并没有生成一个不同单词的列表。有没有人碰到过类似的问题?谢谢您。在


Tags: 列表语法单词stackoverflow参考文献形式句子nltk
1条回答
网友
1楼 · 发布于 2024-09-27 22:23:10

这类信息包含在NLTK的WordNet实现的Lemma类中。具体来说,它可以在Lemma.derivationally_related_forms()中找到。在

下面是一个示例脚本,用于查找“happy”的所有可能的派生形式:

from nltk.corpus import wordnet as wn

forms = set() #We'll store the derivational forms in a set to eliminate duplicates
for happy_lemma in wn.lemmas("happy"): #for each "happy" lemma in WordNet
    forms.add(happy_lemma.name()) #add the lemma itself
    for related_lemma in happy_lemma.derivationally_related_forms(): #for each related lemma
        forms.add(related_lemma.name()) #add the related lemma

不幸的是,WordNet中的信息并不完整。上面的脚本找到了“happy”和“happiness”,但是找不到“happy”,尽管有多个“happy”引理。在

相关问题 更多 >

    热门问题