Python移除HTML标签，如果下一个兄弟节点是相同的，则连同内容一起删除

def removeDuplicates(items): for item in items: if item==item.nextSibling: item.extract() else: children = item.findChildren() removeDuplicates(children) body = soup.find('body') items = body.findChildren() removeDuplicates(items)

1条回答

网友

1楼 · 发布于 2024-10-17 08:37:17

我的代码运行缓慢，因为我假设.findChildren()只获取直接子级（下面的第一级），但实际上它得到了所有子级（来自所有级别）。因此，解决方案是从代码中删除以下行：

    else:
        children = item.findChildren()
        removeDuplicates(children)

编程相关推荐

java JFace应用程序窗口：createContents不工作
是否有一个Java API来列出AWS操作中的所有操作，并带有通配符或AWS服务？
线程“main”java中出现异常。当试图在另一个类中使用方法时，lang.NullPointerException？
为什么Java Swing程序不能显示umlauts（ä，ö，…）等德语字符？
在Java中设置双精度值的小数点后2位
在tablayout中切换选项卡时，java应用程序很滞后
在excel中创建新行，然后使用java填充它
java线程“main”中出现异常。lang.noclassdeffounderror
使用BufferReader“\n”读取后的java不会被接受为新行字符，如何解决此问题？
swing在新窗口中创建JTable作为Java中JMenuItem的操作侦听器

相关问题更多 >

编程相关推荐

热门问题

热门文章

Python移除HTML标签，如果下一个兄弟节点是相同的，则连同内容一起删除

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >