如何在python的larkparser中解析具有unicode字符的字符串

2024-10-06 06:49:51 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图在Python中使用lark解析器来解析一些sql字符串。有些语句中包含unicode字符,导致解析器抛出错误(带ó,é的字符串)。 我使用以下几行在.lark文件中定义字符串

LATIN_LETTER: /[u"\u00a1-\u02af"]/
STRING: (LATIN_LETTER|LETTER|DIGIT|PUNCTUATION)+

抛出错误

E   UnexpectedCharacters: No terminal defined for '�' at line 154 col 126
E   
E   jillo', 'Owner', 'Avda. de la Constitución 2222', 'México D.F.', NULL, '05021'

我是否在.lark文件中错误地指定了unicode字母?正确的方法是什么


Tags: 文件字符串解析器sqlstring定义错误unicode