我是维基媒体的初学者,我正在使用维基API来完成我的项目。我的数据集如下所示:
rev_id | comment | timestamp | page_id | page_title | user_id | user_text
-- -- -- -- -- -- -- -- -- -- -- --
352194497 | Welcome to Wikipedia | 2010-03-26T18:16:48Z | 26709696 | 116.197.206.138 | 8356162 | Mlpearc
我正试图找到这些评论海报的一些用户信息。但是,我发现这里的“user_text”不是用户名而是签名。如果我使用官方API demosget_users.py
来获取信息,结果会出现错误,因为某些签名中有空格,但用户名都是单个单词。就像下面的代码一样,我可以使用Catrope|Bob
获取Catrope和Bob的信息。但是如果我使用Catrope|Tide rolls
,如果潮汐滚动是签名,它就不起作用
import requests
S = requests.Session()
URL = "https://en.wikipedia.org/w/api.php"
PARAMS = {
"action": "query",
"format": "json",
"list": "users",
"ususers": "Catrope|Tide rolls",
"usprop": "blockinfo|groups|editcount|registration|emailable|gender"
}
R = S.get(url=URL, params=PARAMS)
DATA = R.json()
USERS = DATA["query"]["users"]
for u in USERS:
print(str(u["name"]) + " has " + str(u["editcount"]) + " edits.")
所以我的问题是,有没有任何方法可以让我们通过使用API的签名来获取用户信息?既然我们这里也有页面id和用户id,这些信息会有帮助吗?提前非常感谢
更新:我在这里使用Bob Ben
作为假ID。现在它被一个真实的ID所取代。通过使用u替换空间解决了问题。(感谢AXO的提醒。)
你没有提到你得到的错误和回溯。只要用户名存在,代码示例就可以正常工作,即使用户名中有空格
但是user account "Bob Ben" is not registered。在这种情况下,API以
{'name': 'Bob Ben', 'missing': ''}
回复因此,您的代码可能是:
顺便说一句,如果出于某种原因您不喜欢使用空格,您可以使用
_
(下划线)A blank space is equivalent with an underscore.关于“用户信息”,我不知道你在寻找什么样的信息。根据API:Users,可以使用
usprop
参数获得blockinfo|groups|groupmemberships|implicitgroups|rights|editcount|registration|emailable|gender|centralids|cancreate
。但是如果要获取一些其他信息,例如用户页面上的信息,那么您可能需要使用API:Get the contents of a page中提到的方法之一来获取用户页面的内容,然后编写一个程序来查找您需要的信息相关问题 更多 >
编程相关推荐