我在试着把课文中的单词词组化。比如说,pickled应该变成pickle,ran变成run,葡萄干变成raisen等等
我使用nltk的WordNet Lemmatizer
,如下所示:
from nltk.stem import WordNetLemmatizer
>>>
>>> lem = WordNetLemmatizer()
>>> print(lem.lemmatize("cats"))
cat
>>> print(lem.lemmatize("pickled"))
pickled
>>> print(lem.lemmatize("ran"))
ran
因此,正如您在'pickled'
和'ran'
中看到的那样,输出没有如预期的那样出现。如何获得这些单词的'pickle'
和'run'
,而不必为单词指定'v'
(动词)等。在
通过获取传递
'v'
或'n'
参数而不传递任何内容的函数的最常见结果,可以获得名词或动词的lemmatize()
函数的基形式。在这不是一种直接的方法,但是您可以尝试以下代码来获取名词或动词的基本形式:
你得到了基本形式:
^{pr2}$相关问题 更多 >
编程相关推荐