utf8编码并获取字符串sli

2024-10-06 12:39:59 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在解析一个twitter,需要对文本进行编码,因为如果没有编码,就会有一个例外。但是当我使用'utf-8'时,它不仅将b符号添加到控制台输出中,而且还使它无法访问字符串的某些部分。我可以做些什么来修复它,或者我应该尝试其他什么编码方式?在

下面是一个例子。在

>>> a="newyear"
>>> b=a.encode("utf-8")
>>> a
'newyear'
>>> b
b'newyear'
>>> a[0]
'n'
>>> b[0]
110

我的解析器代码如下:

^{pr2}$

所以我可以用try来处理异常,但是我想知道是否有其他方法。在

我用的是python3。在


Tags: 方法字符串代码文本解析器编码符号twitter
1条回答
网友
1楼 · 发布于 2024-10-06 12:39:59

你很困惑什么时候该encode,什么时候decode

如果您有一个bytestring,那么您decode将其转换为unicode

a="a string" 
b = a.decode('utf8') 
#b is now UNICODE

如果你有unicode,你encode它是一个编码的bytestring

^{pr2}$

我怀疑你从twitter上得到了一个bytestring,所以你可能需要

b = a.decode('utf8')

相关问题 更多 >