网页抓取返回标签

2024-10-05 14:25:58 发布

男 | 程序猿一只，喜欢编程写python代码。

我完全不懂HTML。在我写这篇文章之前，我得查一下“标签”和“类”。我知道urllib2现在是这类东西的默认值，但是我无法让我的头正确使用它（否则会出现403拒绝访问错误），所以我使用了requests。你知道吗

import requests
from bs4 import BeautifulSoup

url = 'http://www.grandexchangecentral.com/item.php?rid=4365'
r = requests.get(url, headers={'Referer': 'www.grandexchangecentral.com'})
soup = BeautifulSoup(r.text)
soup.find_all("div", {"class":"CurrentMarket"})

它返回[<div class="CurrentMarket">219</div>]，而我希望它只是219。有人能帮我得到正确的输出吗？谢谢。你知道吗

Tags： import div com url html www 标签 urllib2

1条回答

网友

1楼 · 发布于 2024-10-05 14:25:58

很简单，假设find_all的返回值叫做markets：

markets[0].contents[0]

因为markets是一个列表，所以用[0]获取第一个项目，然后它获取contents（也是一个列表，因此是另一个[0]）

也许看看docs？你知道吗

网页抓取返回标签

相关问题更多 >

编程相关推荐

热门问题

热门文章

网页抓取返回标签

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >