擅长:python、mysql、java
<p>如果删除<code>opts=headless=True</code>选项,后续链接将出现以下错误:</p>
<blockquote>
<p>Access Denied
You don't have permission to access the requested URL on this server.</p>
<p>Reference: 18.3d702617.1593528484.1aacf782</p>
</blockquote>
<p>如果您要更改列表中链接的顺序,则无论第一个链接是什么,都将起作用,但随后的链接将失败。所以,链接本身并没有什么问题。我的猜测是,该网站检测到浏览器正在由自动化(Selenium)运行,并且只允许您进行一页的web访问</p>
<p>我在页面抓取之间暂停了5秒钟,但除了第一页之外,所有抓取都出现了错误,所以这不是抓取速率的问题</p>