如何废弃源代码中没有出现的数据?

2024-10-03 21:24:02 发布

您现在位置:Python中文网/ 问答频道 /正文

一周前,我开始学习scrapy,但对python甚至编码一无所知。不过,我想我理解了这个荒谬的逻辑。 我正试图从这个网站上提取一些数据: https://www.unibet.fr/sport/football/ligue-2,这是一个体育博彩网站。你知道吗

我想把法国足球二级联赛每场比赛的赌注凑齐。例如,对于Auxerre-chateauux遭遇战,我需要以下数字:1.923.304.10。 尽管如此,这些数字似乎在页面的源代码中丢失了。然而,当我右击Auxerre - Châteauroux检查元素时,我发现了这些数字。你知道吗

但似乎我不能用上面提到的网址访问这些号码。此外,使用此URL运行scrapy shell时,会得到以下结果:

>>> fetch("https://www.unibet.fr/sport/football/ligue-2")
2017-12-08 15:37:16 [scrapy.core.engine] INFO: Spider opened
2017-12-08 15:37:16 [scrapy.core.engine] DEBUG: Crawled (200) <GET https://www.unibet.fr/sport/football/ligue-2> (referer: None)

>>> view(response)
True

我如何在页面源中访问这些数字?你知道吗


Tags: httpscore编码网站www数字页面fr