在给定行号和列号的情况下，如何在python中定位XML错误？

urlBase = 'https://www.goodreads.com/review/list_rss/' urlMiddle = '?shelf=read&order=d&sort=rating&per_page=200&page=' finalUrl = urlBase + str(32994) + urlMiddle +str(1) resp = requests.get(finalUrl) from xml.etree import ElementTree as ET x = ET.fromstring(resp.content)

2条回答

网友

1楼 · 编辑于 2024-06-30 15:50:37

很可能您在Windows上，打印不正确，例如\n

尝试添加： open(‘resp.xml’).write(resp.content) 在你得到resp之后

然后，您可以在编辑器中打开resp.xml并查看第952行的外观

网友

2楼 · 编辑于 2024-06-30 15:50:37

您正在尝试使用XML解析器解析HTML内容。如果内容不是XML有效的：如果不是XHTML，则可能会遇到问题

相反，您可以使用类似于lxml的HTML解析器

比如说

parser = etree.HTMLParser()
tree   = etree.parse(BytesIO(resp.content), parser)

这会解决你的问题

编程相关推荐

java调试gzip错误的最佳方法
java web和iOS应用程序之间的关系是什么
java在哪个线程上执行在new CompletableFuture（）上注册的回调？
PGBouncer+JDBC中的java connect_查询设置
Hadoop中java奇怪的不满意链接错误
从java（cx\U oracle）中的python代码连接到oracle DB时出错
java如何找到广播接收器的调用？
java如何在SpringMVC中使用自定义日期属性编辑器验证日期
java二叉树如何帮助将表达式编译成机器语言
Java illegale从集合到抽象集合的转换

相关问题更多 >

编程相关推荐

热门问题

热门文章