用Java将HTML网页呈现为文本
我想以人类可读的形式获取网站的文本表示,例如超链接位置或输入字段
有这样的图书馆吗?(我已经检查了Jericho渲染器,但它不显示输入字段)
比如说
<div>
<form action="example.php">
Name:
<input type="text" name="name_field">
<input type="button" value="OK">
</form>
</div>
像这样的事情
Name: [________] [OK]
# 1 楼答案
试试tag soup然后自己建造。您可以得到HTML的DOM模型,并可以输出文本