对不起,我问了个没用的问题
我正在学习使用BeautifulSoup,并尝试在表中提取特定的数据字符串
网站是https://airtmrates.com/,我想得到的确切字符串是:
VES Bolivar Soberano Bank Value Value Value
表没有任何类,因此我不知道如何查找和解析该字符串
我一直在从屁股里掏东西,但我失败得很惨。这是我最后一次尝试的代码,你可以笑一下:
def airtm():
#URLs y ejecución de BS
url = requests.get("https://airtmrates.com/")
response = requests.get(url)
html = response.content
soup_ = soup(url, 'html.parser')
columns = soup_.findAll('td', text = re.compile('VES'), attrs = {'::before'})
return columns
页面是动态的,这意味着您需要在解析之前呈现页面。你可以用Selenium或Requests-HTML来做
我不太熟悉HTML请求,但我过去使用过Selenium。这会让你走的。而且,每当我想拉一个
<table>
标签时,我喜欢用pandas来解析。但是BeautifulSoup仍然可以使用,只是需要更多的工作来遍历table
、tr
、td
标记。熊猫可以通过.read_html()
为您完成这项工作:输出:
相关问题 更多 >
编程相关推荐