Java正则表达式从HTML锚(<a>…</a>)标记获取文本
我正试图在某个标记内获取文本。如果我有:
<a href="http://something.com">Found<a/>
我希望能够检索Found
文本
我正试着用正则表达式。如果<a href="http://something.com>
保持不变,我就能做到,但事实并非如此
到目前为止,我有:
Pattern titleFinder = Pattern.compile( ".*[a-zA-Z0-9 ]* ([a-zA-Z0-9 ]*)</a>.*" );
我认为最后两个部分([a-zA-Z0-9 ]*)</a>.*
是可以的,但我不知道第一部分该做什么
# 1 楼答案
这里是online ideone demo
这里有一个类似的主题:How to remove the tags only from a text ?