html从字符串java/gwt解析htmltags
嘿,我想从html中解析一些数据,这些数据以字符串形式发送给我。 我想要的数据是大写的,我将在这里把它命名为DATAx。 数据的长度是任意的
http://pastebin.mozilla.org/1270216
还有很多类似的行需要解析
谢谢你
你可以在下面搜索框中键入要查询的问题!
嘿,我想从html中解析一些数据,这些数据以字符串形式发送给我。 我想要的数据是大写的,我将在这里把它命名为DATAx。 数据的长度是任意的
http://pastebin.mozilla.org/1270216
还有很多类似的行需要解析
谢谢你
# 1 楼答案
我在jsoup方面运气很好。它使用jQuery风格的dom节点选择器,可以处理HTML片段,甚至是格式非常糟糕的片段
# 2 楼答案
我不知道jsoup,但是TagSoup是一个很棒的HTML解析库。我已经在一个生产系统中使用它好几年了,它已经在野外运行了数万(至少)个网页,我们从来没有遇到过TagSoup的一次失败。它甚至可以处理最糟糕的HTML格式