擅长:python、mysql、java
<p>我想纽约时报会用cookies验证你的请求。如果请求不是web浏览器的普通请求,则服务器返回Location header。它会让你的请求丢失。在</p>
<p>解决办法很简单。像这样使用cookiejar:</p>
<pre><code>import cookielib, urllib2
cj = cookielib.CookieJar()
opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))
url = "http://www.nytimes.com/interactive/2014/07/07/upshot/how-england-italy-and-germany-are-dominating-the-world-cup.html"
htmlfile = opener.open(url)
htmltext = htmlfile.read();
print htmltext
</code></pre>