xmlformatter忽略小于引号中的值

2024-09-28 22:24:44 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试格式化以下xml

<block formula="MY_VAR < 3"><set-variable name="OTHER_VAR"></set-variable></block>

进入

<block formula="MY_VAR < 3">
  <set-variable name="OTHER_VAR">
  </set-variable>
</block>

使用xmlformatter并由于公式中的<而导致错误。具体来说,错误是

ExpatError: not well-formed (invalid token)

当我尝试代码时

my_xml = '<block formula="MY_VAR < 3"><set-variable name="OTHER_VAR"></set-variable></block>'
formatter = xmlformatter.Formatter(indent="1", indent_char="  ", encoding_output="UTF-8", preserve=["literal"])
pretty_xml = formatter.format_string(my_xml)

如何在公式中包含小于,并能够格式化XML


Tags: namevarmyformatter错误xmlblockvariable
1条回答
网友
1楼 · 发布于 2024-09-28 22:24:44

在构造xml字符串时,可以使用xml.sax.saxutils.quoteattr转义属性值

>>> my_xml = '<block formula=%s><set-variable name="OTHER_VAR"></set-variable></block>' % su.quoteattr('MY_VAR < 3')
>>> my_xml
'<block formula="MY_VAR &lt; 3"><set-variable name="OTHER_VAR"></set-variable></block>'

如果您不控制xml的构造,此黑客将修复示例中的xml:

stack = []

out = []
brackets = '<>'

for c in bad_xml:
    if c in brackets:
        try:
            prev = stack[-1]
        except IndexError:
            stack.append(c)
            out.append(c)
        else:
            if prev == c:
                escaped = '&gt;' if c == '>' else '&lt;'
                out.append(escaped)
            else:
                stack.append(c)
                out.append(c)
    else:
        out.append(c)
my_xml = ''.join(out)

相关问题 更多 >