Python:如何拆分字符串但保留非字母数字字符

2024-09-30 16:34:22 发布

您现在位置:Python中文网/ 问答频道 /正文

我在处理这个问题时遇到了问题:

Sample string - \"H\00E6tta\"

*\00E6是一个unicode,我的脚本可以理解它,尽管它不是通常的形式\u00e6。所以请不要担心那部分。在

我想在分开后会有类似的东西:

^{pr2}$

我这样做了:

sub_glyph = glyph.split("\\")

但我得到的结果是:

['', 'H', '00E6tta', '']

有什么线索吗?我需要“转换成unicode。但它现在不见了。我很困惑,我想我分裂相应的“\”和为什么“会消失。在网上找不到任何足智多谋的指南,需要帮助。在

谢谢


Tags: sample脚本stringunicode指南形式split消失
1条回答
网友
1楼 · 发布于 2024-09-30 16:34:22

使用原始字符串(在字符串前面加上r使其成为原始字符串)和split它:

s = r'\"H\00E6tta\"'

print(s.split('\\'))
# ['', '"H', '00E6tta', '"']

注意:当我们将s作为一个原始字符串时,“literal”字符串(这里)实际上变为\\"H\\00E6tta\\"(使用repr(s)查看更改)。这使得我们的split成为可能。在

相关问题 更多 >