擅长:python、mysql、java
<p>是的,这是一个有趣的问题,实际上可以欺骗许多人当网络抓取数据。。。问题是图表是在JavaScript中的文档就绪后加载的,您可以了解有关文档就绪<a href="https://flaviocopes.com/dom-ready/" rel="nofollow noreferrer">here</a>的更多信息。但本质上,图表是在加载所有HTML、CSS和JS之后呈现的,并且数据绑定到数据属性</p>
<p>我创建了一个代码示例,它使用NodeJS Express server返回JSON中所有图表中的数据。本质上,它点击URL,指向图表所在的类,然后查找包含图表所有数据的data-*attr。这样,当基于JavaScript的图表呈现出现这些情况时,您就可以使用和分叉工作代码</p>
<p>带有NodeJS和Python的GitHub repo解决方案:</strong><a href="https://github.com/joehoeller/dynamic-chart-parser-for-webscraping" rel="nofollow noreferrer">https://github.com/joehoeller/dynamic-chart-parser-for-webscraping</a></p>