美丽的团队。找到所有人对于没有attribu类的嵌套div

2024-10-02 20:40:54 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在使用python2,我想在html页面中获取div的内容。在

<div class="lts-txt2"> 
   Some Content 
</div>

如果div类与上面类似,那么我可以使用

^{pr2}$

但如果女主角是

<div class="lts-txt2">
   <div align="justify">
      Some Content 
   </div>
</div>

然后使用

^{pr2}$

不返回内容。 所以我试着

BeautifulSoup.find_all('div', attrs={"align": 'justify'})

但也没用。 我怎样才能解决这个问题。在


Tags: div内容htmlsome页面contentclassalign
1条回答
网友
1楼 · 发布于 2024-10-02 20:40:54

您可以使用^{} method从节点提取所有文本,包括嵌套节点:

[el.get_text() for el in soup.find_all('div', attrs={"class": 'lts-txt2'})]

这将生成一个列表,其中包含每个这样的div的文本内容,无论其中是否有嵌套的div。在

您还可以使用CSS selector ^{} function来选择嵌套的div:

^{pr2}$

相关问题 更多 >