如何获取维基百科页面的所有存档对话页面?

2024-09-30 01:27:10 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在使用以下代码获取给定Wikipedia页面的talk页面

import pywikibot as pw
page = pw.Page(pw.Site('en'), 'Elon_Musk')
talkpage = page.toggleTalkPage()
talkpage.text

这可以正常工作,但不会返回所有存档的对话页面。是否有一种方法可以通过编程方式找到给定对话页面的归档文件,并通过它们循环获取文本

非常感谢


Tags: 代码importaspagesite页面wikipedia对话
1条回答
网友
1楼 · 发布于 2024-09-30 01:27:10

您可以使用以下代码获取所有子页面:

import pywikibot as pw
site = pw.Site('en', 'wikipedia')
for page in site.allpages(prefix='Elon Musk/', namespace='Talk'):
    print(page.title())
    print(page.text)

存在一个页面“Talk:Elon_Musk/FAQ”。如果不希望包含此页面和类似页面,则需要在返回文本之前添加一行:if 'Archive' in page.title():

相关问题 更多 >

    热门问题