我应该在Python中使用哪种微数据解析器

2024-09-30 22:12:24 发布

您现在位置:Python中文网/ 问答频道 /正文

我在寻找一个高质量的Python中的HTML微数据解析器。它不必很快,但我希望它能支持尽可能多的the spec,包括{}。在

以下是我目前发现的:

你用过这些图书馆吗?优点和缺点是什么?在

我对解析格式不佳的HTML文档也很好奇。你有没有发现一个处理混乱输入的微数据解析器,或者你是先通过类似BeautifulSoup的方式运行输入?在


Tags: the数据httpsorggithubpypicom解析器
1条回答
网友
1楼 · 发布于 2024-09-30 22:12:24

您希望将微数据解析为什么格式?在

https://github.com/RDFLib/pymicrodata将解析为RDF。在

如果您希望使用JSON,那么应该使用https://github.com/edsu/microdata,它最近受到了一些关注,应该更符合规范

https://pypi.python.org/pypi/pelican-microdata/0.1看起来是一种为特定静态站点生成器生成微数据的方法,因此我认为它对解析没有帮助。在

我不知道上面两个解析器对格式不好的HTML有多大的容忍度。如果您知道一些使用微数据的格式不好的标记,我很想看看Ruby解析器如何处理这些情况。在

相关问题 更多 >