Python：如何拆分字符串但保留非字母数字字符

2024-09-30 16:34:22 发布

男 | 程序猿一只，喜欢编程写python代码。

我在处理这个问题时遇到了问题：

Sample string - \"H\00E6tta\"

*\00E6是一个unicode，我的脚本可以理解它，尽管它不是通常的形式\u00e6。所以请不要担心那部分。在

我想在分开后会有类似的东西：

^{pr2}$

我这样做了：

sub_glyph = glyph.split("\\")

但我得到的结果是：

['', 'H', '00E6tta', '']

有什么线索吗？我需要“转换成unicode。但它现在不见了。我很困惑，我想我分裂相应的“\”和为什么“会消失。在网上找不到任何足智多谋的指南，需要帮助。在

谢谢

Tags： sample 脚本 string unicode 指南形式 split 消失

1条回答

网友

1楼 · 发布于 2024-09-30 16:34:22

使用原始字符串（在字符串前面加上r使其成为原始字符串）和split它：

s = r'\"H\00E6tta\"'

print(s.split('\\'))
# ['', '"H', '00E6tta', '"']

注意：当我们将s作为一个原始字符串时，“literal”字符串（这里）实际上变为\\"H\\00E6tta\\"（使用repr(s)查看更改）。这使得我们的split成为可能。在