擅长:python、mysql、java
<p>HTTP状态代码<strong>403</strong>绝对意味着<strong>禁止/拒绝访问</strong><br/>
HTTP状态代码302用于请求的重定向。不用担心他们。<br/>
你的代码好像没什么问题。</p>
<p>是的,这肯定是网站实施的一项防刮措施。</p>
<p>参考这些来自废弃文档的指南:<a href="http://doc.scrapy.org/en/latest/topics/practices.html#avoiding-getting-banned"><strong>Avoid Getting Banned</strong></a></p>
<p>另外,您应该考虑<a href="http://doc.scrapy.org/en/latest/topics/jobs.html">pausing and resuming crawls</a>。</p>