保留专有名词和大写单词，同时使用词干

from nltk.stem.porter import PorterStemmer def stemming(word): stemmer = PorterStemmer() word = str(word) if word.title(): stemmer.stem(word).capitalize() elif word.isupper(): stemmer.stem(word).upper() else: stemmer.stem(word) return word dfBody['body'] = dfBody['body'].apply(lambda x: [stemming(y) for y in x])

1条回答

网友

1楼 · 发布于 2024-10-16 22:24:43

首先：您应该将结果分配给word

word = stemmer.stem(word).capitalize()

第二：word.title()不检查单词是否大写，但它会创建大写单词，所以您应该检查

if word == word.title():

最终

if word[0].isupper() and word[1:].islower():

def stemming(word):
    stemmer = PorterStemmer()
    word = str(word)
    if word == word.title():
        word = stemmer.stem(word).capitalize()
    elif word.isupper():
        word = stemmer.stem(word).upper()
    else:
        word = stemmer.stem(word)
    return word

编程相关推荐

java为什么maven enforcer插件在maven版本3.6.1中失败，但在3.6.2中通过？
尝试从字符串获取日期时发生java ParseException
java使用ArrayList查找匹配的值。contains（）并将其从ArrayList中删除
javascript UTF8编码在飞碟中不起作用
java Android：设备启动时是否可以访问数据库？
java如何在蛇游戏中创建网格
java颜色背景不起作用
java是否可以使用实例pojo与JDBC模板一起插入？
在Tomcat WebApp中运行的Java代码比从JVM调用时运行得慢得多
java GUI添加了组件，但没有显示空白框架

相关问题更多 >

编程相关推荐

热门问题

热门文章

保留专有名词和大写单词，同时使用词干

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >