如何获得包含特定tex的类或ID的scrape DIV

1条回答

网友

1楼 · 发布于 2024-10-01 17:41:17

最简单的方法是使用CSS selector：

soup.select('div[id^=content]')

^=语法指定id属性值应以content开头。在

您可以使用作为^{}的id参数传入的regular expression filter得到相同的结果：

^{pr2}$
演示：
>>> from bs4 import BeautifulSoup >>> sample = '''\ ... <div> ... <div id="content1"> ... </div> ... <div id="content3"> ... </div> ... <div id="content22"> ... </div> ... </div> ... ''' >>> soup = BeautifulSoup(sample) >>> soup.select('div[id^=content]') [<div id="content1"> </div>, <div id="content3"> </div>, <div id="content22"> </div>] >>> soup.find_all('div', id=re.compile('^content')) [<div id="content1"> </div>, <div id="content3"> </div>, <div id="content22"> </div>]

编程相关推荐

C++／爪哇／C图像处理库
由于类org的许多实例而导致java内存泄漏。jboss。vfs。spi。JavaZipFileSystem
java在Android中使用CustomMultiPartEntity取消上传文件
java根据另一个JCombobox填充JCombobox值
安卓 java，如何将Unicode字符更改为普通字符？
java每次出现“CCTGG”时，我为DNA序列创建的字符串生成器都会停止
java Android NDK应用程序抛出错误未满足链接错误
用Java实现mp3音频分解
如何在源java中使用weka 3.7.12中保存的svm（wlsvm）模型类
jsf Spring@Autowired（required=true）为空

相关问题更多 >

编程相关推荐

热门问题

热门文章