我正在创建一个webscraper,它将从这个网站上抓取动态生成的玩家数据
https://frozenpool.dobbersports.com/frozenpool_linecombo.php
我想创建一个循环,从下拉菜单中为玩家生成数据,刮取数据,然后在下拉菜单中循环浏览整个玩家列表
我很好奇,使用selenium与站点交互是否是最好的方式。但我也注意到,每个玩家的URL都遵循特定的模式,因此我考虑删除初始页面以收集我所需的所有数据,然后使用这些数据构建URL列表,然后在URL列表中循环并将其视为静态页面
是否有为这种特定类型的web抓取构建的python工具
看起来您需要的所有信息都加载到了对https://frozenpool.dobbersports.com/frozenpool_linecombo.php的请求中。因为它不会发出额外的请求来获取更多信息
Selenium
对于这个项目来说可能有点过头了,您可以继续使用BeautifulSoup
我认为您的想法是正确的,即使用结构URL在每个播放器之间循环。如果这是一次性抓取,则直接从页面的html复制玩家列表以获取玩家ID,然后循环通过以下URL,用每个玩家标识符替换玩家ID
相关问题 更多 >
编程相关推荐