使用scraperwiki对wikipedia的infobox部分进行爬网

2024-10-03 09:11:03 发布

您现在位置:Python中文网/ 问答频道 /正文

我不熟悉scraperwiki。我正在尝试使用scraperwiki从wiki页面获取infobox。我想到了scraperwiki从下面的链接抓取wiki页面

https://blog.scraperwiki.com/2011/12/how-to-scrape-and-parse-wikipedia/

编码

import scraperwiki

wikipedia_utils = scraperwiki.swimport("wikipedia_utils")

title = "Aquamole Pot"

val = wikipedia_utils.GetWikipediaPage(title)
res = wikipedia_utils.ParseTemplates(val["text"])
print res               # prints everything we have found in the text
infobox_ukcave = dict(res["templates"]).get("Infobox ukcave")
print infobox_ukcave    # prints just the ukcave infobox

错误

^{pr2}$

Tags: thetexttitle链接wikiresutilsval