有 Java 编程相关的问题?

你可以在下面搜索框中键入要查询的问题!

Java正则表达式编号的多行列表

我想解析一个文档并提取编号列表中的每个元素,例如:

 1. I like to blah
    and blah
 2. But also to blah 
    and blah

我想从列表中提取每个元素,比如[1.项目1的文本,2.项目2的文本]我使用了一个正则表达式,比如“[0-9].*之前,因为我认为每个列表项都以结束;但事实并非总是如此。所以我想要一个正则表达式来提取文本,而不是以“;”结尾。 这就是我尝试的:

String regexLineNumber = "[0-9]..*;";
String[] splitted = inputData.split(regexLineNumber);

共 (1) 个答案

  1. # 1 楼答案

    <>我建议你使用一个正则表达式,允许句子中间或结尾的数字。

    (?<=[\n\r\s]*|^)(\d\.[^\d]*)
    

    还要记住使用matches而不是findall