属性类的多个值

3条回答

网友

1楼 · 编辑于 2024-09-29 23:27:57

当BeautifulGroup的所有其他匹配方法都失败时，您可以使用带单个参数（tag）的函数：

>>> url.find(lambda tag: tag.name == 'span' and tag.get('class', []) == ['bday'])
<span class="bday">1899-08-04</span>

上面搜索的是一个span标记，其class属性是单个元素的列表（'bday'）。在

网友

2楼 · 编辑于 2024-09-29 23:27:57

我会这样做的：

import urllib
from BeautifulSoup import BeautifulSoup

url = 'http://en.wikipedia.org/wiki/Ezra_Taft_Benson'
file_pointer = urllib.urlopen(url)
html_object = BeautifulSoup(file_pointer)

bday = html_object('span',{'class':'bday'})[0].contents[0]

这将返回1899-08-04作为bday的值

网友

3楼 · 编辑于 2024-09-29 23:27:57

尝试将lxml与beautifulsoup解析器一起使用。以下内容只找到<span>标记，其中只有bday类（在本页中只有一个）：

>>> from lxml.html.soupparser import fromstring
>>> root = fromstring(open('Ezra_Taft_Benson'))
>>> span_bday_nodes = root.findall('.//span[@class="bday"]')
[<Element span at 0x1be9290>]
>>> span_bday_node[0].text
'1899-08-04'

相关问题更多 >

编程相关推荐

热门问题

热门文章

属性类的多个值

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >