Python正则表达式，不包括多个换行符

网友

1楼 · 编辑于 2024-05-17 02:37:50

与其使用正则表达式，我更愿意一行一行地浏览歌词，并决定是否使用基本上是一个蹩脚的有限状态机来保留每一行：

lyrics1 = '''Lyrics

[Chorus]
Some Lyrics
Other Lyrics'''

lyrics2 = '''[Chorus: x2]
Some Lyrics
Some More Lyrics

[Verse]
Lyrics
Lyrics'''

def clean(lyrics):
    result = []
    omitting = False
    for line in lyrics.split('\n'):
        if '[Chorus' in line:
            omitting = True
        if '[' in line and '[Chorus' not in line:
            omitting = False
        if not omitting:
            result.append(line)
    return '\n'.join(result)

print(clean(lyrics1))
print('      ')
print(clean(lyrics2))

结果：

Lyrics

      
[Verse]
Lyrics
Lyrics

所以基本上，如果我们看到一个“Chorus”行，我们就打开一个标志，停止输出行；然后，如果我们看到任何括号内的东西不是“Chorus”，我们就把这个标志向后翻转，继续输出行。你知道吗

我不知道您正在解析的实际文件是什么样子的，但是像这样的策略可能比在这个问题上抛出大量正则表达式更有成效。你知道吗

网友

2楼 · 编辑于 2024-05-17 02:37:50

你可以尝试下面的正则表达式来匹配所有的合唱块。你知道吗

\[Chorus.*?\].*?(\n{2,}|$)

DEMO

或者

(?!.*\n\n)\[Chorus.*?\].*?$

它只匹配末尾的chorus块。别忘了在两个正则表达式中启用DOTALL修饰符。你知道吗

DEMO

网友

3楼 · 编辑于 2024-05-17 02:37:50

\[Chorus:[^\]]+\][\s\S]*?(?=\n{2}|$)

试试这冷杉所有的种类合唱。替换通过empty string。参见演示。你知道吗

https://regex101.com/r/vN3sH3/77

相关问题更多 >

编程相关推荐

热门问题

热门文章

Python正则表达式，不包括多个换行符

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >