ANTLR4在Python中生成的解析器很慢，但在J中生成的解析器很快

import sys, time from antlr4 import * from parser.CPPGrammarLexer import CPPGrammarLexer from parser.CPPGrammarParser import CPPGrammarParser currenttimemillis = lambda: int(round(time.time() * 1000)) def is_string(object): return isinstance(object,str) def parsecommandstringline(argv): if(2!=len(argv)): raise IndexError("Invalid args size.") if(is_string(argv[1])): return True else: raise TypeError("Argument must be str type.") def doparsing(argv): if parsecommandstringline(argv): print("Arguments: OK - {0}".format(argv[1])) input = FileStream(argv[1]) lexer = CPPGrammarLexer(input) stream = CommonTokenStream(lexer) parser = CPPGrammarParser(stream) print("*** Parser: START ***") start = currenttimemillis() tree = parser.code() print("*** Parser: END *** - {0} ms.".format(currenttimemillis()-start)) pass def main(argv): tree = doparsing(argv) pass if __name__ == '__main__': main(sys.argv)

3条回答

网友

1楼 · 编辑于 2024-09-28 20:51:52

我也遇到了类似的问题，所以我决定用一个可能的解决方案来取代这个旧帖子。我的语法在TestRig上运行很快，但是在python3上运行得非常慢。在

在我的例子中，错误是我用来生成一行注释的非贪婪令牌（C/C++中的双斜线，在我的情况下是'%'）：

TKCOMM : '%' ~[\r\n]* -> skip ;

这在某种程度上得到了sharwell在本次讨论中的帖子的支持：https://github.com/antlr/antlr4/issues/658

When performance is a concern, avoid using non-greedy operators, especially in parser rules.

为了测试这个场景，您可能需要从语法中删除非贪心的规则/标记。在

网友

2楼 · 编辑于 2024-09-28 20:51:52

张贴在这里，因为它可能是有用的人找到这个线索。在

自从发布这篇文章以来，Antlr的Python目标有了一些性能改进。也就是说，Python解释器本质上比Java或其他编译语言慢。在

我为Antlr的Python3目标构建了一个Python加速器代码生成器。它使用ANTLR C++目标作为Python扩展。LISEN和解析是在C++中专门完成的，然后使用自动生成的访问者来重新构建Python中的结果解析树。最初的测试显示了一个5x-25x的加速，这取决于语法和输入，我对如何进一步改进它有一些想法。在

下面是代码生成器工具：https://github.com/amykyta3/speedy-antlr-tool

这是一个功能齐全的例子：https://github.com/amykyta3/speedy-antlr-example

希望这对那些喜欢在Python中使用Antlr的人有用！在

网友

3楼 · 编辑于 2024-09-28 20:51:52

我确认python2和python3运行时存在性能问题。通过一些补丁，我在python3运行时得到了10倍的加速（大约5秒到400毫秒）。 https://github.com/antlr/antlr4/pull/1010

相关问题更多 >

编程相关推荐

热门问题

热门文章