无法在python中使用regex替换字符串中的\xe2\x80\xa6\n

3条回答

网友

1楼 · 编辑于 2024-06-02 00:57:56

如果您想要的话，您必须将字符串定义为raw string，因为python将尝试转换unicode。在

data = r"pizza won't divorce you pizza won't betray you pizza won't cheat on you pizza won't fight with you  why don't people just \xe2\x80\xa6\n"

print re.findall(r"\\[a-z][a-z]?[0-9]+", data)

输出：['\\xe2', '\\x80', '\\xa6']

网友

2楼 · 编辑于 2024-06-02 00:57:56

另一种解决方案：

print re.findall(r"\\[a-z]{1,2}\d{1,2}", data)

网友

3楼 · 编辑于 2024-06-02 00:57:56

要处理文本，应该使用Unicode字符串：b"\xe2\x80\xa6"bytestring是utf-8编码的^{} (U+2026 HORIZONTAL ELLIPSIS)：

text = u"pizza won't divorce\u2026"

要替换它：

^{pr2}$

编程相关推荐

java如何在字符串文本中查找字符串的出现处？
java类对象何时被垃圾回收？
java在没有setter/getter的其他类中切换变量
java禁用依赖项的lint
Android TextView HTML中的java换行符
java Mutiny：处理多个UNI并使用来自“外部”的值
java在JavaFX中使用ComboBox获得选项的空白列表
java仅显示和保存true语句
mavencompilerplugin中使用的release标记/属性和compilerVersion标记/属性之间的差异。升级到java 11时出现的问题
java：单例异常可以工作吗？

相关问题更多 >

编程相关推荐

热门问题

热门文章

无法在python中使用regex替换字符串中的\xe2\x80\xa6\n

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >