有 Java 编程相关的问题?

你可以在下面搜索框中键入要查询的问题!

使用Java在不破坏HTML的情况下以90%的速度对字符串进行子串

创建方法的最佳解决方案是什么?该方法将获取包含HTML的字符串,并将最后一个字符串(比如10%)切掉,但不破坏任何HTML标记

正文和标题标记不是HTML字符串的一部分

此外,四舍五入应该向上进行,所以LAT表示,如果最后10%将缩小到5%,如果HTML保持不变,那么方法应该减少HTML的请求,并执行15%的切割,这将是标签的请求

我想用Jsoup来做这个。问题是字符串可能没有被HTML元素包围。它可能只是一个带有几个链接的文本


共 (1) 个答案

  1. # 1 楼答案

    我认为Jsoup是正确的方法,从页面底部移除元素,并在每一步检查其字符串长度,直到达到满意的数字

    要逐个删除元素,可以使用remove method,然后将原始字符串长度与HTML文档的当前字符串长度进行比较。我认为那里没有任何效率问题