在Python中如何与regex匹配时处理音调符号

1条回答

网友

1楼 · 发布于 2024-10-04 05:32:38

这似乎是一个编码问题。您的代码正常工作。你在期待什么不同的东西吗？前缀为u的字符串是unicode文本。以\u开头的字符是unicode字符，后跟四个十六进制数字，而以\x开头的字符是unicode字符，后跟两个十六进制数字。如果您打印出您的结果（而不是查看他们的__repr__方法），您将看到您收到了您似乎要查找的结果：

results = [u'\u010d\u0107\u0111\u0161', u'Espa\xf1a']
for result in results:
    print result

čćđš
España

在代码中（即在列表中），可以看到这些unicode文本的表示形式：

for result in results:
    print result.__repr__()

u'\u010d\u0107\u0111\u0161'        # what shows up in your list
u'Espa\xf1a'

顺便说一句，似乎您正试图用regex解析html。你应该试试^{}或者类似的东西。这会帮你省去路上的大麻烦。你知道吗

编程相关推荐

java如何使用同级对象的属性执行对象的JSON反序列化？
java在NetBeans的JTextArea中显示Sql列
java为什么是服务。Android中的onBind抽象
java Spring Boot web应用程序如何验证另一个字段所需的表单字段？
java为什么我需要Hibernate中的事务来执行只读操作？
java维度，仅更改宽度/高度
mocking Mockito Java 8参数匹配器any（类<T>）
libgdx中的java渲染Box2D链形状
java找不到符号：方法getFactory（）
java在Maven中运行JUnit测试，无需构建和复制文件

相关问题更多 >

编程相关推荐

热门问题

热门文章

在Python中如何与regex匹配时处理音调符号

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >