UnicodeDecodeError:“gbk”编解码器无法解码中文字节

2024-09-28 22:59:21 发布

您现在位置：Python中文网/ 问答频道 /正文

2745

网友

男 | 程序猿一只，喜欢编程写python代码。

环境： -Mac OS优胜美地 -Python 2.7 -我正在读取的文件文件以txt格式保存

所以我有一个脚本，把中文文本分成句子，下面是代码：

# coding: utf-8 

cutlist ="。！？".decode('utf-8')    
def FindToken(cutlist, char):
    if char in cutlist:
        return True
    else:
        return False


def Cut(cutlist,lines):          
    l = []         
    line = []   

    for i in lines:         
        if FindToken(cutlist,i):      
            line.append(i)         
            l.append(''.join(line))   
            line = []  =
        else:         
            line.append(i)     
    return l


for lines in file("t.txt"):    
    l = Cut(list(cutlist),list(lines.decode('gbk')))     
    for line in l:  
       if line.strip() !="":      
            li = line.strip().split()   
            for sentence in li:
                print sentence

但我得到了以下错误：

有人能给我一些关于是什么导致这个错误的指导吗？谢谢！在

Tags：文件 in txt for return if def line

1条回答

网友

1楼 · 发布于 2024-09-28 22:59:21

因此，我将decode改为utf-8，如下所示：

l = Cut(list(cutlist),list(lines.decode('utf-8')))

它现在起作用了。在

UnicodeDecodeError:“gbk”编解码器无法解码中文字节

相关问题更多 >

编程相关推荐

热门问题

热门文章

UnicodeDecodeError:“gbk”编解码器无法解码中文字节

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >