如何在Python中解析JSONXML混合文件

<XProtocol> { <str1."fds"> "str2" <str3> 123.0 <str4> { 1 2 3 4 5 6 6 "str" "str" 43 "str" 4543 } <weird1."str5"> { <weird2."str6"> { "str" } <also."weird3"> 1 <againweird> { 1 "fds" } { } <even> <more."weird4"> { } { } { } { "a" } } }

import pyparsing as pp def parse_x_prot(text): lbra = pp.Literal('{').suppress() rbra = pp.Literal('}').suppress() lang = pp.Literal('<').suppress() rang = pp.Literal('>').suppress() dot = pp.Literal('.').suppress() cstr = pp.quotedString.addParseAction(pp.removeQuotes) tag = pp.Group( lang + pp.Word(pp.alphanums) + pp.Optional(pp.Group(dot + cstr)) + rang) val = pp.OneOrMore( cstr | pp.Word(pp.nums + '.') ) exp = pp.Forward() exp << pp.OneOrMore( pp.Group( tag + pp.OneOrMore( (lbra + (val | exp) + rbra) | (val + exp) ) ) ) return exp.parseString(text)

3条回答

网友

1楼 · 编辑于 2024-10-06 23:25:26

有几件事：

在tag的定义中，您将其包装为Group，但我认为您确实希望使用Combine。在

第二件事，你在exp中的嵌套混合了重复和递归。在

这对我很有用（同样，以dot上的.suppress()为例）：

tag = pp.Combine(
    lang +
    pp.Word(pp.alphas, pp.alphanums) +
    pp.Optional(dot + cstr) +
    rang).setName("tag")

exp = pp.Forward()
key_value = pp.Group(tag + exp)
number = pp.Regex(r'[+-]?\d+(\.\d*)?').setName("number")
exp <<= (number |
            cstr |
            key_value |
            pp.Group(lbra + pp.ZeroOrMore(exp) + rbra))

给予：

^{pr2}$

网友

2楼 · 编辑于 2024-10-06 23:25:26

这可能不是您想要的答案，但我认为Flex将在这类任务中对您有很大帮助。甚至可能有一个python包装器

网友

3楼 · 编辑于 2024-10-06 23:25:26

我在你的代码中做了一些改动以使它能正常工作，我用注释来指明出了什么问题。在

def parse_x_prot(text):
    # Set up some shortcuts
    lbra = pp.Literal('{').suppress()
    rbra = pp.Literal('}').suppress()
    lang = pp.Literal('<').suppress()
    rang = pp.Literal('>').suppress()
    dot = pp.Literal('.')
    cstr = pp.quotedString.addParseAction(pp.removeQuotes)

    # Define how a correct tag looks like (we use combine here to get the full tag in the output)
    tag = pp.Combine(
        lang +
        pp.Word(pp.alphanums) +
        pp.Optional(pp.Group(dot + pp.quotedString)) +
        rang)

    # Define legal value (first combine is for decimal values)
    val = pp.Combine(pp.Word(pp.nums) + dot + pp.Word(pp.nums)) | cstr | pp.Word(pp.nums)

    # Define the array with statement as recursion element
    statement = pp.Forward()
    array = pp.Group(pp.OneOrMore(tag) +
                     pp.OneOrMore(
                         (
                             # Note the one or more function here as we have 
                             # a kind of list here which will have elements
                             (lbra + pp.OneOrMore(val | statement) + rbra) |
                             val |
                             (lbra + rbra)
                         )
                     )
                     )

    statement << array
    return statement.parseString(text)

相关问题更多 >

编程相关推荐

热门问题

热门文章