我想解析可以由两个以上的\n
字符分隔的文本块(不是段落)。例如:
Lorem ipsum dolor sit amet, consectetur adipiscing elit. Morbi quam nunc, pretium quis tincidunt in, tincidunt vel arcu. Class aptent taciti sociosqu ad litora torquent per conubia nostra. Lorem ipsum dolor sit amet, consectetur adipiscing elit. Morbi quam nunc, pretium quis tincidunt in, tincidunt vel arcu. Class aptent taciti sociosqu ad litora torquent per conubia nostra. Lorem ipsum dolor sit amet, consectetur adipiscing elit. Morbi quam nunc, pretium quis tincidunt in, tincidunt vel arcu. Class aptent taciti sociosqu ad litora torquent per conubia nostra.
第一个块用\n\n
分隔,但第二个和第三个块用\n\n\n
分隔。我只想使用string.split(r'\n\n')
而不是regex,但是文本可以有任意数量的换行来分隔每个块。我似乎找不到一个允许任意数量换行的regex。在
re.split("\n\n+",my_text)
。。。我想会有用的你也可以这么做
如果没有正则表达式,这应该可以正常工作
可以通过以下几种方式指定重复:
*
-重复上一个元素零次或多次+
-重复上一个元素一次或多次{m,n}
-在m
和n
之间重复上一个元素,m
如果没有提供,默认为0,n
默认为无限(实际上是65535,但这是一个实现细节)。在因此,为了匹配重复两次或更多次的
\n
,您可以使用\n{2,}
。在相关问题 更多 >
编程相关推荐