from nltk.corpus import wordnet as wn
forms = set() #We'll store the derivational forms in a set to eliminate duplicates
for happy_lemma in wn.lemmas("happy"): #for each "happy" lemma in WordNet
forms.add(happy_lemma.name()) #add the lemma itself
for related_lemma in happy_lemma.derivationally_related_forms(): #for each related lemma
forms.add(related_lemma.name()) #add the related lemma
这类信息包含在NLTK的WordNet实现的
Lemma
类中。具体来说,它可以在Lemma.derivationally_related_forms()
中找到。在下面是一个示例脚本,用于查找“happy”的所有可能的派生形式:
不幸的是,WordNet中的信息并不完整。上面的脚本找到了“happy”和“happiness”,但是找不到“happy”,尽管有多个“happy”引理。在
相关问题 更多 >
编程相关推荐