from nltk.stem import WordNetLemmatizer
lemmatizer= WordNetLemmatizer()
data1['lematized']=""
data1['lematized']=data1['punctuation_removal'].apply(lambda x
:lemmatizer.lemmatize(x))
我使用这段代码来对自然语言项目中的数据进行柠檬化,但返回的错误
UnicodeDecodeError: 'ascii' codec can't decode byte 0x92 in position 1039: ordinal not in range(128)
我试着把默认编码改成UTF-8,但没有成功
当我提供标记数据作为输入时
from nltk.stem import WordNetLemmatizer
lemmatizer= WordNetLemmatizer()
data1['lematized']=""
data1['lematized']=data1['word_tagging'].apply(lambda x :lemmatizer.lemmatize(x))
Error: TypeError: unhashable type: 'list'
如何解决这个问题
目前没有回答
相关问题 更多 >
编程相关推荐