lxml，序列化时缺少doctype

2条回答

网友

1楼 · 编辑于 2024-09-28 05:22:28

到目前为止，我能够让它正常工作的唯一方法是使用默认的XML解析器并向文档添加一个非空的系统URL：

>>> html = etree.parse(StringIO('''<!DOCTYPE HTML PUBLIC "-//IETF//DTD HTML//EN" " ">\n<HTML></HTML>'''))
>>> etree.tostring(html, method="xml")
'<!DOCTYPE HTML PUBLIC "-//IETF//DTD HTML//EN" " ">\n<HTML/>'
>>> etree.tostring(html, method="html")
'<!DOCTYPE HTML PUBLIC "-//IETF//DTD HTML//EN" " ">\n<HTML></HTML>'

使用HTMLParser的相同操作会产生相同的docinfo，但不会得到所需的输出：

^{pr2}$

网友

2楼 · 编辑于 2024-09-28 05:22:28

Bug，如对另一个答案的注释所述：missing doctype when serialized。将于2015年2月在lxml的3.5版本中发布。在

编程相关推荐

java Pinch zoom仅放大到中心
简单java程序中的折扣错误
java使用SAP JCO调用获取JCO_错误_系统_失败
java servicedesk plus webflux curl（api3）
字符串java int toString（）错误
java我对Kotlin Android Studio 4的Gradle同步有问题
java如何通过引用从Firebase获取一个对象数据
java Esper规则语言：从模式返回类的数据字段
oop Java抽象类实现了一个接口，两者都有相同的方法
java将大型Gzip数据文件上载到HDFS

相关问题更多 >

编程相关推荐

热门问题

热门文章

lxml，序列化时缺少doctype

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >