如何使用签名读取xml文件（&S）

Traceback (most recent call last): File "<stdin>", line 2, in <module> File "lxml.etree.pyx", line 3239, in lxml.etree.parse (src/lxml/lxml.etree.c:69955) File "parser.pxi", line 1769, in lxml.etree._parseDocument (src/lxml/lxml.etree.c:102257) File "parser.pxi", line 1789, in lxml.etree._parseFilelikeDocument (src/lxml/lxml.etree.c:102516) File "parser.pxi", line 1684, in lxml.etree._parseDocFromFilelike (src/lxml/lxml.etree.c:101442) File "parser.pxi", line 1134, in lxml.etree._BaseParser._parseDocFromFilelike (src/lxml/lxml.etree.c:97069) File "parser.pxi", line 582, in lxml.etree._ParserContext._handleParseResultDoc (src/lxml/lxml.etree.c:91275) File "parser.pxi", line 683, in lxml.etree._handleParseResult (src/lxml/lxml.etree.c:92461) File "parser.pxi", line 622, in lxml.etree._raiseParseError (src/lxml/lxml.etree.c:91757) lxml.etree.XMLSyntaxError: xmlParseEntityRef: no name, line 5, column 30

2条回答

网友

1楼 · 编辑于 2024-09-30 00:32:26

由于xml文件格式不正确，因此由于ampersand（预定义的xml实体）可以使用BeautifulSoup。它是一个更容错的解析器。在

from bs4 import BeautifulSoup
soup = BeautifulSoup(data)
print soup.find("title").text

输出

^{pr2}$

网友

2楼 · 编辑于 2024-09-30 00:32:26

如果需要保留&字符，可以将文件解析为HTML。在

from lxml import html
tree = html.parse(path)

如果不需要&字符，可以创建一个新的XML解析器并传递recover=True选项。在

^{pr2}$

相关问题更多 >

编程相关推荐

热门问题

热门文章