我正在寻找解析维基百科对话页面(例如,https://en.wikipedia.org/wiki/Talk:Elon_Musk)。我想通过贡献者/编辑循环阅读文本。不知道我该怎么做。目前,我有以下代码:
import pywikibot as pw
wikiPage="elon_musk"
page = pw.Page(pw.Site('en'), wikiPage)
talkpage = page.toggleTalkPage()
s=talkpage.text
cs=talkpage.contributors()
似乎很难解析文本(即s)并找到每个贡献者制作的对话文本。不确定撰稿人的演讲从何处开始和结束,以及演讲文本是对他人演讲文本的回应。有没有一种方法可以让talk page返回我可以循环使用的片段
非常感谢你的帮助
我不知道pywikibot,但是你可以通过普通的API来实现。这将获取修订:https://en.wikipedia.org/w/api.php?action=query&prop=revisions&titles=Talk:Elon%20Musk&rvlimit=500&rvprop=timestamp|user|comment|ids
然后,您可以传递修订ID以在每次编辑中获得更改:例如https://en.wikipedia.org/w/api.php?action=compare&fromrev=944235185&torev=944237256
相关问题 更多 >
编程相关推荐