python-feedu语法分析器中错误匹配的解决方法

2024-07-02 14:14:13 发布

您现在位置:Python中文网/ 问答频道 /正文

我在用Pythonfeedparse.py模块版本5.2.1。正在尝试从usnews读取源,例如https://www.usnews.com/rss/the-report。我得到了一个带有rss2.0头的xml文件 在

feedparser返回“status”:403,“encoding”:“us ascii”,“bozo斨u exception”:SAXParseException('mismatched tag',),'version':'”

状态403似乎是请求错误,但提供的异常是解析器错误。我想知道是否有解决此错误的方法(例如更改解析器的“严格性”

谢谢你

import feedparser
f = feedparser.parse('https://www.usnews.com/rss/news/the-run-2016',
                 agent='Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.98 Safari/537.36')

以上是显示错误的最简单示例。我一直在使用feedpy解析器几个月来,在一个生产应用程序中,它只是示例和美国新闻网在那里我遇到了错误。谢谢你看。在

错误如下:

^{pr2}$

新闻---

而且,我的浏览器可以快速解析xml。在


Tags: 模块thepyhttps版本com解析器示例
1条回答
网友
1楼 · 发布于 2024-07-02 14:14:13

如果不深入研究这里的实际情况(这很可能是feedparser问题或返回的编码问题),那么在feedparser实例中包含agent就是罪魁祸首。使用:

import feedparser
f = feedparser.parse('https://www.usnews.com/rss/news/the-run-2016')

似乎可以缓解你的问题。至于为什么,这值得进一步研究。在

相关问题 更多 >