如何解析没有分隔符的元组？

equals = Suppress("=") token = Word(alphanums + "-,./_:*+=#[];") decimal = Regex(r'-?0|[1-9]\d*').setParseAction(lambda t:int(t[0])) stringTemplate = token | decimal sexpList = Group(Suppress("(") + ZeroOrMore(sexp) + Suppress(")")) sexp = Forward()

multilineString = Group(token + equals + OneOrMore(stringTemplate) + ~FollowedBy(stringTemplate + equals)) multilineString = Group(token + equals + OneOrMore(stringTemplate) + NotAny(stringTemplate + equals)) multilineString = Group(token + equals + OneOrMore(stringTemplate) + ~(stringTemplate + equals))

1条回答

网友

1楼 · 发布于 2024-06-26 02:24:30

使用~FollowedBy是正确的，但是这些表达式必须是OneOrMore重复表达式的一部分。比如：

multilineString = Group(token + equals + OneOrMore(stringTemplate + ~FollowedBy(equals)))
for match in multilineString.searchString(test):
    match.pprint()

其他一些评论：

看看token、decimal和stringTemplate的定义。现在的情况是，您永远不会匹配decimal表达式。为了避免将integer误认为token，我建议您将token改为Word(alphas, alphanums + "-,./_:*+=#[];")
您可能需要重新考虑是否允许“=”作为token的一部分。如果有人省略了token和定界符“=”之间的空格，那么原本应该是定界符的内容将被吸进token键中。你知道吗
考虑添加结果名称以帮助您访问每个键值对的键值位：multilineString = Group(token("key") + equals + OneOrMore(stringTemplate + ~FollowedBy(equals))("value"))。然后您可以像match.key和match.value那样访问它们—当然，您可以使用列表索引将键获取为match[0]，但是我发现命名的访问更容易使用。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章