我试图浏览一个pandas数据帧上收集的评论列表,并将这些单词标记化,然后将这些单词放入数据框中的新列中,但我在执行此操作时遇到了一个错误,是
错误说明AttributeError:“unicode”对象没有属性“apwords”
还有别的办法吗?谢谢
def apwords(words):
filtered_sentence = []
words = word_tokenize(words)
for w in words:
filtered_sentence.append(w)
return filtered_sentence
addwords = lambda x: x.apwords()
df['words'] = df['complaint'].apply(addwords)
print df
您应用
lambda
函数的方法是正确的,您定义addwords
的方法行不通。在当您定义
apwords
时,您定义的是function
,而不是attribute
,因此当您要应用它时,请使用:而不是:
^{pr2}$如果要使用},并将{}定义为该类中的一个属性。在
apwords
作为属性,则需要定义继承自string
的{与
function
呆在一起要容易得多:你不想这样做:
您不需要定义函数
^{pr2}$addwords
。应定义为:相关问题 更多 >
编程相关推荐