Python3在编码时不分割字符串

2条回答

网友

1楼 · 编辑于 2024-09-28 22:26:05

您产生了一个bytes表示；您在这里损坏了repr()调试输出。任何不可打印的字符或特殊字符都将被它们的转义序列替换。您生成的输出在字符串中没有制表符，它包含两个字符的序列\和{}：

>>> '\t'
'\t'
>>> '\t'.encode('utf8')
b'\t'
>>> str('\t'.encode('utf8'))
"b'\\t'"
>>> str('\t'.encode('utf8'))[1:]
"'\\t'"
>>> str('\t'.encode('utf8'))[1:][1:-1]
'\\t'
>>> len(str('\t'.encode('utf8'))[1:][1:-1])
2

我不清楚为什么首先要将文本编码成字节，然后再转换回字符串。一般来说，你不想那样做。在

在IDLE中，您并没有生成这样混乱的输出；您只是有一个带有实际制表符的常规字符串，因此对这些制表符进行拆分就可以了。我唯一的建议是不要在这里编码到字节。在

网友

2楼 · 编辑于 2024-09-28 22:26:05

看起来eachLine是一个原始字符串。在

>>> r'<!ENTITY DOCUMENT_STATUS\t\t\t\t\t"draft">\n'.split('\t')
['<!ENTITY DOCUMENT_STATUS\\t\\t\\t\\t\\t"draft">\\n']

所以，您应该使用一个原始的\t（r'\t'）来分割它，如下所示

^{pr2}$

或者使用正确转义的\t（'\\t'），如下所示

>>> r'<!ENTITY DOCUMENT_STATUS\t\t\t\t\t"draft">\n'.split('\\t')
['<!ENTITY DOCUMENT_STATUS', '', '', '', '', '"draft">\\n']

相关问题更多 >

编程相关推荐

热门问题

热门文章

Python3在编码时不分割字符串

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >