网页抓取返回标签

2024-10-05 14:25:58 发布

您现在位置:Python中文网/ 问答频道 /正文

我完全不懂HTML。在我写这篇文章之前,我得查一下“标签”和“类”。我知道urllib2现在是这类东西的默认值,但是我无法让我的头正确使用它(否则会出现403拒绝访问错误),所以我使用了requests。你知道吗

import requests
from bs4 import BeautifulSoup

url = 'http://www.grandexchangecentral.com/item.php?rid=4365'
r = requests.get(url, headers={'Referer': 'www.grandexchangecentral.com'})
soup = BeautifulSoup(r.text)
soup.find_all("div", {"class":"CurrentMarket"})

它返回[<div class="CurrentMarket">219</div>],而我希望它只是219。有人能帮我得到正确的输出吗?谢谢。你知道吗


Tags: importdivcomurlhtmlwww标签urllib2
1条回答
网友
1楼 · 发布于 2024-10-05 14:25:58

很简单,假设find_all的返回值叫做markets

markets[0].contents[0]

因为markets是一个列表,所以用[0]获取第一个项目,然后它获取contents(也是一个列表,因此是另一个[0]

也许看看docs?你知道吗

相关问题 更多 >