我试图从URL:https://www.prokabaddi.com/stats/0-102-total-points-statistics中删除动态内容。我试过使用selenium和BeautifulSoup,但都给我一个空列表。 我的代码是:
url = "https://www.prokabaddi.com/stats/0-102-total-points-statistics"
# create a new Chrome session
driver = webdriver.Chrome()
driver.get(url)
soup.find_all("div", class_="sipk-lb-playerName")
这将返回一个空列表。当我在控制台中检查数据时,数据是存在的,但是在页面源中,数据和div标记不存在。我相信这与js呈现的内容有关。你知道吗
如何从这个URL中提取玩家的名字和点数。你知道吗
下面是一个可能的基于
selenium
的解决方案:输出:
在dev工具下查看XHR。您将看到直接提取数据的url。它作为json返回,但可以将其转换为表:
代码:
输出:
并筛选以仅获取名称和点数:
相关问题 更多 >
编程相关推荐