使用python从下拉菜单中获取所有动态生成的数据的最佳方法 - 问答 - Python中文网

使用python从下拉菜单中获取所有动态生成的数据的最佳方法

2024-09-30 16:29:23 发布

您现在位置：Python中文网/ 问答频道 /正文

男 | 程序猿一只，喜欢编程写python代码。

我正在创建一个webscraper，它将从这个网站上抓取动态生成的玩家数据

https://frozenpool.dobbersports.com/frozenpool_linecombo.php

我想创建一个循环，从下拉菜单中为玩家生成数据，刮取数据，然后在下拉菜单中循环浏览整个玩家列表

我很好奇，使用selenium与站点交互是否是最好的方式。但我也注意到，每个玩家的URL都遵循特定的模式，因此我考虑删除初始页面以收集我所需的所有数据，然后使用这些数据构建URL列表，然后在URL列表中循环并将其视为静态页面

是否有为这种特定类型的web抓取构建的python工具

Tags：数据 https com url 列表网站玩家动态

1条回答

网友

1楼 · 发布于 2024-09-30 16:29:23

看起来您需要的所有信息都加载到了对https://frozenpool.dobbersports.com/frozenpool_linecombo.php的请求中。因为它不会发出额外的请求来获取更多信息Selenium对于这个项目来说可能有点过头了，您可以继续使用BeautifulSoup

我认为您的想法是正确的，即使用结构URL在每个播放器之间循环。如果这是一次性抓取，则直接从页面的html复制玩家列表以获取玩家ID，然后循环通过以下URL，用每个玩家标识符替换玩家ID

http://frozenpool.dobbersports.com/frozenpool_linecombo.php?select=F&forward=PLAYER_ID&games=2019-2020%3AR%3A99&period=ALL&situation=ALL

相关问题更多 >

编程相关推荐

热门问题

热门文章