2024-09-30 22:12:24 发布
网友
我在寻找一个高质量的Python中的HTML微数据解析器。它不必很快,但我希望它能支持尽可能多的the spec,包括{}。在
以下是我目前发现的:
你用过这些图书馆吗?优点和缺点是什么?在
我对解析格式不佳的HTML文档也很好奇。你有没有发现一个处理混乱输入的微数据解析器,或者你是先通过类似BeautifulSoup的方式运行输入?在
您希望将微数据解析为什么格式?在
https://github.com/RDFLib/pymicrodata将解析为RDF。在
如果您希望使用JSON,那么应该使用https://github.com/edsu/microdata,它最近受到了一些关注,应该更符合规范
https://pypi.python.org/pypi/pelican-microdata/0.1看起来是一种为特定静态站点生成器生成微数据的方法,因此我认为它对解析没有帮助。在
我不知道上面两个解析器对格式不好的HTML有多大的容忍度。如果您知道一些使用微数据的格式不好的标记,我很想看看Ruby解析器如何处理这些情况。在
您希望将微数据解析为什么格式?在
https://github.com/RDFLib/pymicrodata将解析为RDF。在
如果您希望使用JSON,那么应该使用https://github.com/edsu/microdata,它最近受到了一些关注,应该更符合规范
https://pypi.python.org/pypi/pelican-microdata/0.1看起来是一种为特定静态站点生成器生成微数据的方法,因此我认为它对解析没有帮助。在
我不知道上面两个解析器对格式不好的HTML有多大的容忍度。如果您知道一些使用微数据的格式不好的标记,我很想看看Ruby解析器如何处理这些情况。在
相关问题 更多 >
编程相关推荐