改进python中从表中抓取数据的代码

2024-10-01 00:19:50 发布

您现在位置:Python中文网/ 问答频道 /正文

使用BeautifulSoup我设法从所有东西都有标签的网页上获取数据,但如果没有标签,我的工作就很糟糕

我想从以下方面得到美元汇率: http://www.bancochile.cl/cgi-bin/cgi_mone?pagina=inversiones/mon_tasa/cgi_mone

该值在下面以黄色突出显示:

image

经过大量的尝试和错误,我设法得到美元汇率,但我认为必须有一个更好的方法

import requests
from bs4 import BeautifulSoup

page = requests.get("http://www.bancochile.cl/cgi-bin/cgi_mone?pagina=inversiones/mon_tasa/cgi_mone")
soup = BeautifulSoup(page.content, 'html.parser')

tables = soup.find_all("table")
dollar = tables[4].find_all("td")

print(dollar[5].string)

有没有更好或更正确的方法来做到这一点

另外,我也不确定问题是否出在我编写代码的方式上,或者是无法更好地理解html结构,无法以更有效的方式导航到信息


Tags: 方法httpbinclwww标签cgimon