UnicodeDecodeError:'ascii'编解码器无法解码1039位的字节0x92:序号不在范围内（128）

2024-09-30 20:32:16 发布

男 | 程序猿一只，喜欢编程写python代码。

from nltk.stem import WordNetLemmatizer
lemmatizer= WordNetLemmatizer()
data1['lematized']=""
data1['lematized']=data1['punctuation_removal'].apply(lambda x 
:lemmatizer.lemmatize(x))

我使用这段代码来对自然语言项目中的数据进行柠檬化，但返回的错误

UnicodeDecodeError: 'ascii' codec can't decode byte 0x92 in position 1039: ordinal not in range(128)

我试着把默认编码改成UTF-8，但没有成功

当我提供标记数据作为输入时

    from nltk.stem import WordNetLemmatizer
    lemmatizer= WordNetLemmatizer()
    data1['lematized']=""
    data1['lematized']=data1['word_tagging'].apply(lambda x :lemmatizer.lemmatize(x))

Error: TypeError: unhashable type: 'list'

如何解决这个问题

Tags：数据 lambda in from import apply lemmatizer lemmatize

0条回答

目前没有回答

UnicodeDecodeError:'ascii'编解码器无法解码1039位的字节0x92:序号不在范围内（128）

相关问题更多 >

编程相关推荐

热门问题

热门文章

UnicodeDecodeError:'ascii'编解码器无法解码1039位的字节0x92:序号不在范围内（128）

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >