我正在解析一个twitter,需要对文本进行编码,因为如果没有编码,就会有一个例外。但是当我使用'utf-8'时,它不仅将b符号添加到控制台输出中,而且还使它无法访问字符串的某些部分。我可以做些什么来修复它,或者我应该尝试其他什么编码方式?在
下面是一个例子。在
>>> a="newyear"
>>> b=a.encode("utf-8")
>>> a
'newyear'
>>> b
b'newyear'
>>> a[0]
'n'
>>> b[0]
110
我的解析器代码如下:
^{pr2}$所以我可以用try来处理异常,但是我想知道是否有其他方法。在
我用的是python3。在
你很困惑什么时候该
encode
,什么时候decode
如果您有一个bytestring,那么您
decode
将其转换为unicode如果你有unicode,你
^{pr2}$encode
它是一个编码的bytestring我怀疑你从twitter上得到了一个bytestring,所以你可能需要
相关问题 更多 >
编程相关推荐