正则表达式不可拆分

网友

1楼 · 编辑于 2024-05-13 18:47:09

Split仅对带有语音标记的参数进行拆分，例如：

用.split(" ")拆分“这个字符串”，结果是：

["this","string"]

但是用.split("s ")拆分它会导致：

["thi", "string"]

而不是：

["thi", "tring"]

这就是你的问题。您的代码只有在一次获得(\bBlock1\b\n\s\s[u].*\n.*)时才会分裂！你知道吗

我建议使用多个分割函数或一个不同的函数，如translate。你知道吗

网友

2楼 · 编辑于 2024-05-13 18:47:09

您不一定需要正则表达式，如果一行以Block开头并将结果收集到字典中，则可以逐行检查正则表达式：

from collections import defaultdict

data = defaultdict(list)
with open("input.txt") as f:
    for line in f:
        if line.startswith("Block"):
            key = line.strip()
        else:
            data[key].append(line.strip())

print(dict(data))

印刷品：

{
  'Block3': ['a 1.01 2.02', '0.01 2.11'], 
  'Block2': ['v 0.00 2.01', '0.01 2.11'], 
  'Block1': ['u 0.00 2.00', '0.11 2.11']
}

网友

3楼 · 编辑于 2024-05-13 18:47:09

在Python中处理正则表达式时，总是使用原始字符串。\b表示字符串中的反斜杠，它会被计算，正则表达式也会被破坏。只需在字符串前面加一个“r”。这将达到以下目的：

re.split(r"(\bBlock1\b\n\s\s[u].*\n.*)", open('Blockfile.txt', "r").read())

相关问题更多 >

编程相关推荐

热门问题

热门文章

正则表达式不可拆分

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >