如何在python中刮取复杂的表?

2024-09-29 19:36:19 发布

您现在位置:Python中文网/ 问答频道 /正文

所以我尝试着从一个页面上刮下赌注,在尝试了很多网站后,发现靓汤找不到所有的必修课,我就登陆了这一个。问题是,它的格式非常糟糕。不管怎样,这是我的密码。你知道吗

import requests
import lxml.html as lh

tennis_url = requests.get("http://odds.aussportsbetting.com/betting?competitionid=1", headers={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/66.0.3359.181 Safari/537.36'})
page = lh.fromstring(tennis_url.content)
tr_elements = page.xpath('//tr')
print([len(T) for T in tr_elements[0:-1]])

这里是网站:http://odds.aussportsbetting.com/betting?competitionid=1

这告诉我每一行都有一堆不同的列,他们几乎用一个表来构建整个网站??你知道吗

我真的需要一些帮助,并希望通过所有这些行和列排序,只是得到我想要的行。更确切地说,几率是:0

非常感谢您的帮助!!你知道吗


Tags: importcomhttpurl网站pageelementsrequests

热门问题