css类=fb_pagZ
以及这个类下的所有li
a
所以在css中应该是:fb_pagZ li a
,但是我很难看到如何在beautifulsoup中表示它
我目前有一个beautifulsoup代码,它可以找到页面上所有名为fb_pagZ
的类,但是我似乎无法进一步深入到列表项,特别是li a
,只解析href
值
next_page_base=soup.find_all(class_='fb_pagZ')
html输出示例:
<div class="fb_pagZ">
<li><a href="site.com/img=2" /></li>
</div>
有人能帮忙吗
您可以使用BeautifulSoup的
select
选择器对元素进行CSS样式的选择因此,根据您的描述,以下应该是:
假设,
soup
是一个BeautifulSoup
对象还要注意,要仅选择第一个元素,请使用
select_one
:要迭代选择并获取
href
属性的值:当不存在这样的元素时,
soup.select('.fb_pagZ li a')
的输出将是一个空列表,因此上述迭代无论如何都不会发生如果你想明确地表达空虚:
如果您也想匹配
href
属性:或者可以使用
.get
并检查None
(这是错误的):相关问题 更多 >
编程相关推荐