使用Java在不破坏HTML的情况下以90%的速度对字符串进行子串
创建方法的最佳解决方案是什么?该方法将获取包含HTML的字符串,并将最后一个字符串(比如10%)切掉,但不破坏任何HTML标记
正文和标题标记不是HTML字符串的一部分
此外,四舍五入应该向上进行,所以LAT表示,如果最后10%将缩小到5%,如果HTML保持不变,那么方法应该减少HTML的请求,并执行15%的切割,这将是标签的请求
我想用Jsoup来做这个。问题是字符串可能没有被HTML元素包围。它可能只是一个带有几个链接的文本
# 1 楼答案
我认为Jsoup是正确的方法,从页面底部移除元素,并在每一步检查其字符串长度,直到达到满意的数字
要逐个删除元素,可以使用remove method,然后将原始字符串长度与HTML文档的当前字符串长度进行比较。我认为那里没有任何效率问题