2024-09-27 23:22:32 发布
网友
我有这样一个清单:
['<option value="284">\xc2\xa0\xc2\xa0\xc2\xa0\xc2\xa0 Historia </option>', '<option value="393">\xc2\xa0\xc2\xa0\xc2\xa0\xc2\xa0 H\xc3\xa4lsa & sk\xc3\xb6nhet </option>']
如何将此列表转换为具有实际可读元素的列表?在
我相信是在ISO 8859-1。在
使用.decode()方法解码字符串值;实际上您看到的是UTF-8数据:
.decode()
>>> print lst[0].decode('utf8') <option value="284"> Historia </option> >>> print lst[1].decode('utf8') <option value="393"> Hälsa & skönhet </option>
第一个字节表示Unicode代码点U+00a0,一个不间断的空格( 作为HTML实体):
看起来像UTF-8:
>>> s=['<option value="284">\xc2\xa0\xc2\xa0\xc2\xa0\xc2\xa0 Historia </option>', '<option value="393">\xc2\xa0\xc2\xa0\xc2\xa0\xc2\xa0 H\xc3\xa4lsa & sk\xc3\xb6nhet </option>'] >>> for v in s: ... print v.decode('utf8') ... <option value="284"> Historia </option> <option value="393"> Hälsa & skönhet </option>
使用
.decode()
方法解码字符串值;实际上您看到的是UTF-8数据:第一个字节表示Unicode代码点U+00a0,一个不间断的空格(
^{pr2}$
作为HTML实体):看起来像UTF-8:
相关问题 更多 >
编程相关推荐