Python正则表达式匹配但不包括字符靓汤

titleList = [] def getTitle(productUrl): res = requests.get(productUrl, headers=headers) res.raise_for_status() soup = bs4.BeautifulSoup(res.text, 'lxml') title = re.compile(r'title=[A-Za-z0-9]+') findTitle = title.findall(res.text.strip()) titleList.append(findTitle)

2条回答

网友

1楼 · 编辑于 2024-09-29 03:34:47

将re.findall与捕获组一起使用可以做到：

>>> import re
>>> text = 'a bunch of junk title=book1 more junk text title=book2'
>>> re.findall(r'title=(\S+)', text)
['book1', 'book2']
>>>

网友

2楼 · 编辑于 2024-09-29 03:34:47

您的正则表达式没有捕获组。您还应该注意，findall返回一个列表，因此应该使用extend而不是{}（除非您希望titleList是一个列表列表列表）。在

title = re.compile(r'title=([A-Za-z0-9]+)')   # note parenthesis
findTitle = title.findall(res.text.strip())
titleList.extend(findTitle)   # using extend and not append

一个独立的例子：

^{pr2}$

编程相关推荐

在java中合并XML，使多个节点的标记名与子节点相同？
在java中，selenium在接口中没有构造函数
模式涉及美元符号（$）时的java正则表达式
java如何在应用程序第一次启动时运行特定代码？
java可以推断和/或构建适当的目录结构
java Else语句在处理所有文本文件之前执行
无法从请求中获取值。getParameterJavaJSP
java Log4j2抛出NoSuchMethodError
java JavaFX事件回调回父单元
java开关编译错误

相关问题更多 >

编程相关推荐

热门问题

热门文章

Python正则表达式匹配但不包括字符靓汤

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >