漂亮的汤过滤函数找不到一个标签页的所有行

<table summary='foo'> <tbody> <tr> A bunch of data </tr> <tr> More data </tr> . . . 100s of <tr> tags later </tbody> </table>

1条回答

网友

1楼 · 发布于 2024-10-02 14:21:47

更像是一个有教养的猜测，但我会试试看。在

BeautifulSoup解析HTML的方式很大程度上取决于underlying parser。如果您不specify it explicitly，BeautifulSoup将根据内部排名自动选择一个：

If you don’t specify anything, you’ll get the best HTML parser that’s installed. Beautiful Soup ranks lxml’s parser as being the best, then html5lib’s, then Python’s built-in parser.

在您的情况下，我会尝试切换解析器，看看您会得到什么结果：

soup = BeautifulSoup(data, "lxml")  # needs lxml to be installed
soup = BeautifulSoup(data, "html5lib")  # needs html5lib to be installed
soup = BeautifulSoup(data, "html.parser")  # uses built-in html.parser

编程相关推荐

c#什么时候使用公共字段才有意义？
JavaRMI何时创建存根、启动注册表并指定代码库？
java强制子级使用自己定义的枚举
java安卓跨越Html。fromHtml（stringWithCDATA）仍然将标记显示为文本
java如何通过按键和释放使循环开始和结束？
java我可以使用什么工具从多个图像创建单个PNG？
java Sonarqube给了我删除代码的问题，无法过滤问题
java Firebase Firestore：如何在Android上将文档对象转换为POJO
JavaSwing:JTextArea列问题
java将数组对象及其变量列表到Main方法

相关问题更多 >

编程相关推荐

热门问题

热门文章

漂亮的汤过滤函数找不到一个标签页的所有行

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >