NLM正在处理一些任务。我的输入是法语文本,所以在我的上下文中,只有Snowball词干分析器可用。但是,不幸的是,它总是给我可怜的茎,因为它连plural "s"
或{
from nltk.stem import SnowballStemmer
SnowballStemmer("french").stem("pommes, noisettes dorées & moelleuses, la boîte de 350g")
Output: 'pommes, noisettes dorées & moelleuses, la boîte de 350g'
词干分析器的词干是单词而不是句子,所以要对句子进行标记,并对标记进行单独的词干处理。在
相关问题 更多 >
编程相关推荐