在python中使用regex匹配令牌的可变出现次数

网友

1楼 · 编辑于 2024-10-02 18:20:08

您可以使用两个正则表达式一个用于名称，另一个用于项目，在第一个空格后应用一个：

import re

lines = ['&{dict1_name}=   key1=key1value   key2=key2value',
         '&{dict2_name}=   key1=key1value']

name = re.compile('^&\{(\w+)\}=')
item = re.compile('(\w+)=(\w+)')

for line in lines:
    n = name.search(line).group(1)
    i = '{{{}}}'.format(','.join("'{}' : '{}'".format(m.group(1), m.group(2)) for m in item.finditer(' '.join(line.split()[1:]))))
    exec('{} = {}'.format(n, i))
    print(locals()[n])

输出

^{pr2}$

说明

'^&\{(\w+)\}='匹配一个'&'，后跟一个由大括号'\{', '\}'包围的单词{}。第二个regex匹配由'='连接的任何单词。行：

^{3}$

创建字典文本，最后使用exec创建具有所需名称的字典。您可以访问字典查询局部变量的值。在

网友

2楼 · 编辑于 2024-10-02 18:20:08

结合听写理解使用两种表达方式：

import re

junkystring = """
lorem ipsum
&{dict1_name}=   key1=key1value   key2=key2value
&{dict2_name}=   key1=key1value
lorem ipsum
"""

rx_outer = re.compile(r'^&{(?P<dict_name>[^{}]+)}(?P<values>.+)', re.M)
rx_inner = re.compile(r'(?P<key>\w+)=(?P<value>\w+)')

result = {m_outer.group('dict_name'): {m_inner.group('key'): m_inner.group('value')
            for m_inner in rx_inner.finditer(m_outer.group('values'))}
            for m_outer in rx_outer.finditer(junkystring)}

print(result)

产生

^{pr2}$

这两个表达式是 ^{3}$

{见^ a1。第二个呢

(?P<key>\w+)=(?P<value>\w+)
# the key/value pairs

请参见a demo for the latter on regex101.com。在

剩下的就是在听写理解中对不同的表达方式进行简单的排序。在

网友

3楼 · 编辑于 2024-10-02 18:20:08

正如您所指出的，您需要解决这样一个事实：捕获组只捕获最后一个匹配项。一种方法是利用文件中的行是iterable这一事实，并使用两种模式：一种用于“line name”，另一种用于其多个keyvalue对：*

import re

dname = re.compile(r'^&{(?P<name>\w+)}=')
keyval = re.compile(r'(?P<key>\w+)=(?P<val>\w+)')

data = {}
with open('input/keyvals.txt') as f:
    for line in f:
        name = dname.search(line)
        if name:
            name = name.group('name')
            data[name] = dict(keyval.findall(line))

_{*诚然，这有点低效，因为每行执行两次搜索。但对于中等大小的文件，应该没问题。}

结果：

^{pr2}$

请注意，\w匹配Unicode单词字符。在

样本输入，keyvals.txt公司名称：

^{3}$

相关问题更多 >

编程相关推荐

热门问题

热门文章