如何刮掉一个懒加载表单？

class BdItemSpider(scrapy.Spider): name = "bdspider" start_urls = [ "http://bddatabase.net/jp/weapon/" ] def parse(self, response): item = BdItem() items = response.xpath("//table[@id='WeaponTable']/tbody//tr/td/text()") print(items.extract())

1条回答

网友
1楼 · 发布于 2024-09-30 02:31:49

我认为有两种方法可以解决这个问题。在
第一个，正如eLRuLL所评论的，是实际执行JavaScript呈现。然而，硒可能比需要的更复杂。您可以尝试使用无头浏览器，如PhantomJS或Splash。这些无头浏览器将为您呈现JavaScript。这种方法相对容易实现，但对刮板的性能有影响。在
第二个选项是实际抓取XHR请求的HTTP位置。在Firefox中，可以使用Firebug扩展过滤所有XHR请求并找到正确的请求。一般来说，这个选项可以提高性能，尽管实现起来可能更复杂。在

编程相关推荐

Android java。NoClassDefFoundError:安卓。地图。主屏幕
请有人解释一下Java代码语法中的缩略语
java JavaFx setOnCloseRequest&文件检查等待
当servlet发生异常时，java如何重定向到错误页面？
java引用了新的小故障
java从可展开列表视图中的子级获取值
如何使用Java方法/参数
java操作HorizontalScrollView的视图
java如何避免必须设置端口转发
当我编译我的程序时，我得到了ErrorSampleApplet。java使用或覆盖不推荐使用的API。并使用xlint重新编译：详细信息，请参阅弃用

相关问题更多 >

编程相关推荐

热门问题

热门文章