我正试图从URL中获取动态内容:https://www.prokabaddi.com/stats/0-102-total-points-statistics。我试过使用selenium和BeautifulSoup,但都得到了一个空列表。 我的代码是:
url = "https://www.prokabaddi.com/stats/0-102-total-points-statistics"
# create a new Chrome session
driver = webdriver.Chrome()
driver.get(url)
soup.find_all("div", class_="sipk-lb-playerName")
这将返回一个空列表。当我在控制台中检查数据时,数据是存在的,但在页面源中,数据和div标记不存在。我相信这与js呈现的内容有关
如何从这个URL中提取玩家姓名和点数
在dev工具下查看XHR。您将看到直接提取数据的url。它以json的形式返回,但可以将其转换为表:
代码:
输出:
和过滤器仅获取名称和点数:
下面是一个可能的基于
selenium
的解决方案:输出:
相关问题 更多 >
编程相关推荐