使用python从下拉菜单中获取所有动态生成的数据的最佳方法

2024-09-30 16:29:23 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在创建一个webscraper,它将从这个网站上抓取动态生成的玩家数据

https://frozenpool.dobbersports.com/frozenpool_linecombo.php

我想创建一个循环,从下拉菜单中为玩家生成数据,刮取数据,然后在下拉菜单中循环浏览整个玩家列表

我很好奇,使用selenium与站点交互是否是最好的方式。但我也注意到,每个玩家的URL都遵循特定的模式,因此我考虑删除初始页面以收集我所需的所有数据,然后使用这些数据构建URL列表,然后在URL列表中循环并将其视为静态页面

是否有为这种特定类型的web抓取构建的python工具


Tags: 数据httpscomurl列表网站玩家动态
1条回答
网友
1楼 · 发布于 2024-09-30 16:29:23

看起来您需要的所有信息都加载到了对https://frozenpool.dobbersports.com/frozenpool_linecombo.php的请求中。因为它不会发出额外的请求来获取更多信息Selenium对于这个项目来说可能有点过头了,您可以继续使用BeautifulSoup

我认为您的想法是正确的,即使用结构URL在每个播放器之间循环。如果这是一次性抓取,则直接从页面的html复制玩家列表以获取玩家ID,然后循环通过以下URL,用每个玩家标识符替换玩家ID

http://frozenpool.dobbersports.com/frozenpool_linecombo.php?select=F&forward=PLAYER_ID&games=2019-2020%3AR%3A99&period=ALL&situation=ALL

相关问题 更多 >