擅长:python、mysql、java
<p>我找到了原因:</p>
<p>momondo使用以下方法来阻止不真实的web客户端。在</p>
<ol>
<li>检测用户代理。不能是curl的默认UA。在</li>
<li>检测“Connection”报头。在我的初始测试中必须使用“keep alive”而不是“keep alive”。在</li>
<li>检测“接受编码”标头。不能空,可以用任何东西。在</li>
</ol>
<p>最后,我现在可以使用curl来获取内容:</p>
<blockquote>
<p>curl -v -H "User-Agent: Mozilla/5.0 (Macintosh; Intel Mac OS X
10_10_3) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/44.0.2403.89
Safari/537.36" -H "Connection: keep-alive" -H "Accept-Encoding:
nothing" <a href="http://www.momondo.com.cn/" rel="nofollow noreferrer">http://www.momondo.com.cn/</a></p>
</blockquote>
<p>顺便说一句,我已经做了七年的网络垃圾。这是我第一次遇到一个网站使用这种防刮方法。标记一下。在</p>