擅长:python、mysql、java
<p>如果您试图访问大量使用JavaScript的网站,总体而言,<a href="http://seleniumhq.org/" rel="nofollow">Selenium</a>可能更容易。在</p>
<p>Selenium是一个控制服务器上实际的web浏览器的服务器,以及一个客户端库(包括Python端口),它允许您控制浏览器并检查其中的页面。在</p>
<p>预先配置(并确定)服务器和客户端库(并确保您的系统上有一个可以正常工作的浏览器)的开销肯定会更大,但是如果网站使用JavaScript做了很多事情,那么实际的抓取代码就不会那么麻烦了。在</p>