如何在Python中使用BS4、Scrapy或类似的工具来获取Raphaël SVG？

1条回答

网友

1楼 · 发布于 2024-09-30 22:19:37

你的主要问题是这个网站使用Javascript创建内容。很可能可以确定它调用以获取所需的数据并直接请求，或者另一种方法是使用selenium来自动化浏览器。这将等待网页完全呈现，然后您可以从中提取完整的HTML。在

然后可以使用beautifulsoup帮助解析返回的HTML。例如：

from selenium import webdriver
from selenium.webdriver.firefox.firefox_binary import FirefoxBinary
from bs4 import BeautifulSoup

url = "http://www.sanzarrugby.com/therugbychampionship/match-centre/?season=2018&competition=214&match=2891#matchstatstab"

browser = webdriver.Firefox()
browser.get(url)
soup = BeautifulSoup(browser.page_source, "html.parser")
data = [v.text for v in soup.svg.find_all('tspan')]

print data

为您提供data的条目列表，如下所示：

^{pr2}$

您需要研究如何安装这些软件包。在

编程相关推荐

java数独生成器循环
java如何使用Executor创建Jersey 2客户端
java调用阅读器。在DigitalPersona U.are中捕获（）。U SDK不返回
安卓 studio中未找到java类错误
基于颜色对象的java Set Excel样式（背景）
MongoDB java更新为空数组
java无法在安卓 studio中解析XML错误
java JGit签出上一次提交
java在从9.0.1升级到google play services 9.4.0后出现错误。getMap（）；
动态计时器JAVA setTitle

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何在Python中使用BS4、Scrapy或类似的工具来获取Raphaël SVG？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >