python-feedu语法分析器中错误匹配的解决方法

2024-07-02 14:14:13 发布

您现在位置：Python中文网/ 问答频道 /正文

8495

网友

男 | 程序猿一只，喜欢编程写python代码。

我在用Pythonfeedparse.py模块版本5.2.1。正在尝试从usnews读取源，例如https://www.usnews.com/rss/the-report。我得到了一个带有rss2.0头的xml文件在

feedparser返回“status”：403，“encoding”：“us ascii”，“bozo斨u exception”：SAXParseException（'mismatched tag'，），'version'：'”

状态403似乎是请求错误，但提供的异常是解析器错误。我想知道是否有解决此错误的方法（例如更改解析器的“严格性”

谢谢你

import feedparser
f = feedparser.parse('https://www.usnews.com/rss/news/the-run-2016',
                 agent='Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/71.0.3578.98 Safari/537.36')

以上是显示错误的最简单示例。我一直在使用feedpy解析器几个月来，在一个生产应用程序中，它只是示例和美国新闻网在那里我遇到了错误。谢谢你看。在

错误如下：

^{pr2}$

新闻---

而且，我的浏览器可以快速解析xml。在

Tags：模块 the py https 版本 com 解析器示例

1条回答

网友

1楼 · 发布于 2024-07-02 14:14:13

如果不深入研究这里的实际情况（这很可能是feedparser问题或返回的编码问题），那么在feedparser实例中包含agent就是罪魁祸首。使用：

import feedparser
f = feedparser.parse('https://www.usnews.com/rss/news/the-run-2016')

似乎可以缓解你的问题。至于为什么，这值得进一步研究。在

python-feedu语法分析器中错误匹配的解决方法

相关问题更多 >

编程相关推荐

热门问题

热门文章

python-feedu语法分析器中错误匹配的解决方法

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >