scrapy正则表达式无法找到长破折号

response.xpath('some xpath goes here').re(r'[\w\s\\u2014\.,]+') response.xpath('some xpath goes here').re(r'[\w\s\\u2014\.,]+') response.xpath('some xpath goes here').re(r'[\w\s\\x2014\.,]+') response.xpath('some xpath goes here').re(r'[\w\s\\uFFFF\.,]+') response.xpath('some xpath goes here').re(r'[\w\s\.,—]+') response.xpath('some xpath goes here').re(r'[\w\s\u(\w){4}\.,]+') response.xpath('some xpath goes here').re(r'[\w\s(\u(\d)){6}\.,]+')

1条回答

网友

1楼 · 发布于 2024-10-01 17:33:42

将模式转换为unicode字符串，不要转义\。在

response.xpath('some xpath goes here').re(ur'[\w\s\u2014\.,]+')

另外，我想您可能希望使用^{}标志，这样\w和{}将匹配所有Unicode单词和空白字符。根据Scrapy文档，^{}不支持标志，但它可以使用已编译的正则表达式，因此yy可以执行以下操作：

^{pr2}$

编程相关推荐

C++／爪哇／C图像处理库
由于类org的许多实例而导致java内存泄漏。jboss。vfs。spi。JavaZipFileSystem
java在Android中使用CustomMultiPartEntity取消上传文件
java根据另一个JCombobox填充JCombobox值
安卓 java，如何将Unicode字符更改为普通字符？
java每次出现“CCTGG”时，我为DNA序列创建的字符串生成器都会停止
java Android NDK应用程序抛出错误未满足链接错误
用Java实现mp3音频分解
如何在源java中使用weka 3.7.12中保存的svm（wlsvm）模型类
jsf Spring@Autowired（required=true）为空

相关问题更多 >

编程相关推荐

热门问题

热门文章