使用pyparsing在多行上解析单词escapesplit问题的回答

使用pyparsing在多行上解析单词escapesplit

回答此问题可获得 20 贡献值，回答如果被采纳可获得 50 分。

0 条评论
分类：Python问答

默认排序时间排序

1 个回答

匿名 1天前

　擅长：python、mysql、java

在四处探访了一下之后，我发现<a href="http://pyparsing.wikispaces.com/message/view/home/11262229" rel="nofollow noreferrer">this help thread</a>那里有一个值得注意的地方 <blockquote> I often see inefficient grammars when someone implements a pyparsing grammar directly from a BNF definition. BNF does not have a concept of "one or more" or "zero or more" or "optional"... </blockquote> 这样，我就有了改变这两条线的想法 <pre><code>multi_line_word = Forward() multi_line_word << (word | (split_word + multi_line_word)) </code></pre> 到 ^{2}$ 这让它输出了我想要的：<code>['super', 'cali', fragi', 'listic']</code>。在 接下来，我添加了一个parse操作，它将把这些标记连接在一起： <pre><code>multi_line_word.setParseAction(lambda t: ''.join(t)) </code></pre> 这将给出<code>['supercalifragilistic']</code>的最终输出。在 我学到的一条信息是，一个人不仅仅是<a href="http://waxy.org/random/images/weblog/mortor.gif" rel="nofollow noreferrer">walk into Mordor</a>。在 开玩笑而已。在 主要的信息是，不能简单地用pyparsing实现BNF的一对一转换。应该调用一些使用迭代类型的技巧。在 编辑2009年11月25日：为了补偿更复杂的测试用例，我将代码修改为以下代码： <pre><code>no_space = NotAny(White(' \t\r')) # make sure that the EOL immediately follows the escape backslash continued_ending = Literal('\\') + no_space + lineEnd word = Word(alphas) # make sure that the escape backslash immediately follows the word split_word = word + NotAny(White()) + Suppress(continued_ending) multi_line_word = OneOrMore(split_word + NotAny(White())) + Optional(word) multi_line_word.setParseAction(lambda t: ''.join(t)) </code></pre> 这样做的好处是确保任何元素之间没有空格（转义反斜杠后面的换行符除外）。在

使用pyparsing在多行上解析单词escapesplit

1 个回答

相关Python问题