寻找wikidump python库的示例或文档

2024-09-30 12:30:27 发布

您现在位置:Python中文网/ 问答频道 /正文

我偶然发现了wikidumppython库,我认为它非常适合我。在

我可以通过查看源代码来应付,但我是python新手,我不想编写BS代码,因为我需要它的项目对我来说有点重要。在

我有维基特定日期页面-文章.xml.bz2'文件,我需要使用它作为获取单个文章的源。有谁能给我一些正确实现这一点的建议,或者,更好的,指出一些文档?我找不到任何东西!在

(另请注意,如果你有更好和合适的医生,请告诉我)


Tags: 文件项目代码文档bs源代码文章页面
1条回答
网友
1楼 · 发布于 2024-09-30 12:30:27

不确定我是否理解这个问题,但是如果您有Wikipedia转储,并且需要解析wikicode,我建议使用mwparserfromhelllib。在

另一个强大的框架是Pywikibot,这是Wikipedia上面向bot用户的历史性框架(因此,它有许多脚本专门用于编写页面,而不是阅读和解析文章)。它有很多文档(尽管,有时会过时),并且使用mediawikiapi。在

当然,您可以同时使用它们:PWB用于获取文章,mwparserfromhell用于解析。在

相关问题 更多 >

    热门问题