我在用Pythonfeedparse.py模块版本5.2.1。正在尝试从usnews读取源,例如https://www.usnews.com/rss/the-report。我得到了一个带有rss2.0头的xml文件 在
feedparser返回“status”:403,“encoding”:“us ascii”,“bozo斨u exception”:SAXParseException('mismatched tag',),'version':'”
状态403似乎是请求错误,但提供的异常是解析器错误。我想知道是否有解决此错误的方法(例如更改解析器的“严格性”
谢谢你
import feedparser
f = feedparser.parse('https://www.usnews.com/rss/news/the-run-2016',
agent='Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.98 Safari/537.36')
以上是显示错误的最简单示例。我一直在使用feedpy解析器几个月来,在一个生产应用程序中,它只是示例和美国新闻网在那里我遇到了错误。谢谢你看。在
错误如下:
^{pr2}$新闻---
而且,我的浏览器可以快速解析xml。在
如果不深入研究这里的实际情况(这很可能是feedparser问题或返回的编码问题),那么在feedparser实例中包含
agent
就是罪魁祸首。使用:似乎可以缓解你的问题。至于为什么,这值得进一步研究。在
相关问题 更多 >
编程相关推荐