2024-09-27 23:24:49 发布
网友
我正在尝试解析url'http://www.5min.com/handlers/sitemapphandler.ashx?python2.7中的type=videositemap&page=1'。问题是当我在urlopen中打开url时,它不显示源代码,而是显示奇怪的字符。它可能被编码了。在
您正在分析Web服务器的响应,而不是.ashx文件。在浏览器中打开该url。这就是python在使用urlopen打开它时所看到的。在
从打开的时候我得到的回复是:
Cache-Control:private Content-Encoding:gzip Content-Length:1100193 Content-Type:application/xml Date:Mon, 11 Jul 2011 20:21:40 GMT Server:Microsoft-IIS/7.5 Set-Cookie:NSC_bobmztjt-5njo-opjq*80=ffffffff4304fd3345525d5f4f58455e445a4a423660;expires=Mon, 11-Jul-2011 20:23:42 GMT;path=/;httponly X-AspNet-Version:4.0.30319 X-Powered-By:ASP.NET X-Server:fmv-m09 - www
事实上,响应看起来是xml格式的。因此,您将需要使用ElementTree(或您喜欢的其他东西)来解析xml。还要注意,服务器正在发送编码为gzip(ZipFile)的响应,它可能会这样做,也可能不会发送,这取决于urlopen是否允许这样做。如果您看到Urlopen的胡言乱语,请尝试使用python的ZipFile来解压缩响应
您正在分析Web服务器的响应,而不是.ashx文件。在浏览器中打开该url。这就是python在使用urlopen打开它时所看到的。在
从打开的时候我得到的回复是:
事实上,响应看起来是xml格式的。因此,您将需要使用ElementTree(或您喜欢的其他东西)来解析xml。还要注意,服务器正在发送编码为gzip(ZipFile)的响应,它可能会这样做,也可能不会发送,这取决于urlopen是否允许这样做。如果您看到Urlopen的胡言乱语,请尝试使用python的ZipFile来解压缩响应
相关问题 更多 >
编程相关推荐