如何提取标签值？

# Title advertTitle = firstAdvert.find_all( "section", {"class": "aditem-main"})[0].find("h2").text.encode("utf-8").strip().replace("\n", "") # Price advertPrice = firstAdvert.find_all( "section", {"class": "aditem-details"})[0].find("strong").text.encode("utf-8").strip().replace("\n", "") # Time advertTimeAdded = advertTitle = firstAdvert.find_all( "section", {"class": "aditem-addon"})[0].text.encode("utf-8").strip().replace("\n", "")

3条回答

网友

1楼 · 编辑于 2024-09-27 21:29:32

你可以这样做：

data = []
for element in soup.find_all({'data-adid':'79924470'}):
    data.append(element['data-adid']

这应该将data-adid的每个值添加到列表data。在

网友

2楼 · 编辑于 2024-09-27 21:29:32

由于使用的是BeautifulSoup，因此可以执行以下操作来提取属性的值：

soup = BeautifulSoup(file, "lxml")
print soup.article['data-adid'] # output : 79924470

网友

3楼 · 编辑于 2024-09-27 21:29:32

可以使用一系列选择来获取以下各种元素：

from bs4 import BeautifulSoup

soup = BeautifulSoup(html, "lxml")
print soup.article['data-adid']
image = soup.select('div.imagebox.srpimagebox')[0]
print image['data-href']
print image['data-imgsrc']
print soup.select('section h2 a')[0].text
print ', '.join([v.strip() for v in soup.select('section.aditem-details')[0].text.strip().split('\n')])
print soup.select('section.aditem-addon')[0].get_text(strip=True)

显示：

^{pr2}$

相关问题更多 >

编程相关推荐

热门问题

热门文章