使用beautifulSoup和prin访问属性

from bs4 import BeautifulSoup import urllib2 url = "http://www.example.it" page = urllib2.urlopen(url) soup = BeautifulSoup(page, 'html.parser') links = soup.findAll('h2') print "".join([str(x) for x in links] )

2条回答

网友

1楼 · 编辑于 2024-10-01 13:28:25

问题是title不是h2标记的属性，而是包含在其中的标记的属性。因此，必须首先搜索<h2>标记，然后搜索具有title属性的子标记：

titles = []
h2_list = links = soup.findAll('h2')
for h2 in h2_list:
    titles.extend(h2.findAll(lambda x: x.has_attr('title')))

这是因为BeautifulSoup可以使用函数作为搜索过滤器

网友

2楼 · 编辑于 2024-10-01 13:28:25

您需要在attrs中传递键值对

findAll('h2', attrs = {"key":"value"})

编程相关推荐

if语句如何使用Java计算输入的平均值？
尝试构建安卓Studio（液体滑动）上板屏幕时，任务“：app:processDebugMainManifest”的java执行失败
java Android开发：在单独的类文件中有一个异步任务
java无法在SAXParser中解析文件和处理程序
java在ResultSet类型_SCROLL _SENSITIVE和类型_SCROLL _SENSITIVE之间的差异
如何从Java客户端（没有CSV文件）创建BigQuery数据集和表/模式
java如何在应用程序运行时存储、编辑和删除数据。安卓
java我们需要HyperJAXB生成的hashCode&equals方法吗？
java如何为我的图形制作addedge函数。我需要将边添加到节点
c语言中的java代码点等价物#

相关问题更多 >

编程相关推荐

热门问题

热门文章

使用beautifulSoup和prin访问属性

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >