java需要帮助使用正则表达式来提取标记中的数据
一段时间以来,我一直在努力创建一个正则表达式,以满足我对下面HTML的需求。我正在使用java。util。正则表达式。*由于不同的原因,我需要使用这个包,而不是任何第三方库
我想要的是提取标签中的数据,所以在这个特定的HTML中我想要的数据是25/25,Lindhagen,0,Spinninghall,35和Test Person
是否可以为此创建正则表达式
<div id="rsv_detail">
<hr />
<label>Bokningsstatus</label>
<span> </span>
<label>Bokningar</label>
<span>25 / 25 </span>
<br />
<label>Plats</label>
<span>Lindhagen </span>
<label>Anlänt</label>
<span>0 </span>
<br />
<label>Sal</label>
<span>Spinninghall </span>
<label>Max antal</label>
<span>35 </span>
<br />
<label>Ledare</label>
<span>Test Person </span>
<br /><br />
<label>Visa mer</label>
<span>
<a href="/index.php?instructors%5B%5D=X129518&func=la&tak=0.36507500+1302460619">Ledare</a>
<a href="/index.php?locations=LI&func=la&tak=0.36507500+1302460619">Plats</a>
<a href="/index.php?activities=SP_MEDEL&func=la&tak=0.36507500+1302460619">Aktivitet</a>
</span>
<br /><br />
<br />
<br />
<hr />
</div>
# 1 楼答案
输出:
这假设目标
<span>
始终以
结尾,并且从不包含任何其他实体或元素# 2 楼答案
如果过滤掉同一行中未打开和关闭span标记的每一行,可以使用:
巴拉特黑塞人建立了一个捕获群,你以后可以通过第一个数字从左到右引用它——这里只有一个,因此是1美元。在开始标记之后,你阅读所有内容,除了一个小于号,你希望它是结束标记,直到结束标记
然而,在大多数情况下,我会同意斯特玛和装满鳗鱼的气垫船。html中正则表达式的陷阱有:
然而,在极少数情况下,正则表达式是有用的: