在python中解析.ashx文件

2024-09-27 23:24:49 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试解析url'http://www.5min.com/handlers/sitemapphandler.ashx?python2.7中的type=videositemap&page=1'。问题是当我在urlopen中打开url时,它不显示源代码,而是显示奇怪的字符。它可能被编码了。在


Tags: comhttpurl编码源代码handlerstypepage
1条回答
网友
1楼 · 发布于 2024-09-27 23:24:49

您正在分析Web服务器的响应,而不是.ashx文件。在浏览器中打开该url。这就是python在使用urlopen打开它时所看到的。在

从打开的时候我得到的回复是:

Cache-Control:private
Content-Encoding:gzip
Content-Length:1100193
Content-Type:application/xml
Date:Mon, 11 Jul 2011 20:21:40 GMT
Server:Microsoft-IIS/7.5
Set-Cookie:NSC_bobmztjt-5njo-opjq*80=ffffffff4304fd3345525d5f4f58455e445a4a423660;expires=Mon, 11-Jul-2011 20:23:42     GMT;path=/;httponly
X-AspNet-Version:4.0.30319
X-Powered-By:ASP.NET
X-Server:fmv-m09 - www

事实上,响应看起来是xml格式的。因此,您将需要使用ElementTree(或您喜欢的其他东西)来解析xml。还要注意,服务器正在发送编码为gzip(ZipFile)的响应,它可能会这样做,也可能不会发送,这取决于urlopen是否允许这样做。如果您看到Urlopen的胡言乱语,请尝试使用python的ZipFile来解压缩响应

相关问题 更多 >

    热门问题