我很困惑,当你想给一个孩子做螃蟹时,汤是多么的美味。 所以,我有下面的HTML代码
<div class="media item avatar profile">
<a href="http://..." class="media-link action-medialink">
<img class="media-item-img" src="http://...jpeg" alt="name" title="name" width="150" height="200">
</a>
</div>
我想抓住src标签。我使用以下代码:
soup = BeautifulSoup(file_)
for x in soup.find('div', attrs={'class':'media item avatar profile'}).findNext('img'):
print x
这会打印整个img标签。如何仅选择src?
谢谢你。
我想你会想要这样的东西:
src
是一个attribute of the tag。一旦有了标记,就可以像访问字典键一样访问属性;您只找到了a
标记,因此还需要导航到包含的img
标记:您的代码使用了
findNext()
,它返回一个标记对象;循环给您子对象,因此x
是img
对象。我把它改得更直接更清晰。x
现在是div
,我们直接导航到第一个a
,并包含img
标记。findNext
返回与给定条件匹配并出现在文档中给定标记之后的第一个项。注意,这意味着它返回的任何标记都不能保证是给定标记的子标记(例如,div
标记的子标记)使用
findChildren
将限制为给定标记的子标记:收益率
相关问题 更多 >
编程相关推荐