我正在抓取一个链接如下的页面:
<a id="something" href="place" class="thing" data="12345">
<span class="otherthing"></span></a>
我想提取数据字段中的数字。我一直在尝试这样使用BeautifulSoup:
soup = BeautifulSoup(response)
for a in soup.findAll('a'):
if 'data' in a['a']:
print a['a']['data']
但我有个关键错误。你知道吗
要仅获取具有
<a>
属性的data
元素,请执行以下操作:要仅保留那些在
data
属性中包含整数的元素,请执行以下操作:也许这就是你需要的:
相关问题 更多 >
编程相关推荐