如何从GoogleScholar中提取某一领域所有教授的信息(引文、印地语、当前工作机构等)?

2024-10-01 13:34:09 发布

您现在位置:Python中文网/ 问答频道 /正文

我想通过数据挖掘和分析技术,比较世界各地不同院校某一领域教授的不同信息(引文、h指数等)。但我不知道如何从数百名(甚至数千名)教授那里提取这些数据,因为Google没有提供官方API。所以我想知道还有其他的方法吗?在


Tags: 数据方法数据挖掘api信息官方google指数
1条回答
网友
1楼 · 发布于 2024-10-01 13:34:09

使用这个google code tool将计算一个单独的h-索引,但是如果您在某个特定字段中按需对有限的数字执行此操作,则不会破坏terms of use-它不具体指访问限制,而是指服务中断(例如批量请求可能会这样做)export问题状态:

我编写了一个程序来下载大量搜索结果,但你阻止了我的电脑访问谷歌学者。你能提高限额吗?
呃,不,请尊重我们的机器人.txt当你使用自动软件访问谷歌学者。作为一个穿着爬虫鞋和站长帽子的人,我们不能建议他们高度遵守网络标准。在

科学网确实有一个API和一个collaboration agreement with google scholar,但科学网只适用于certain individuals

一个解决方案可能是请求用户的网络科学证书(或您自己的)按需返回信息-可能是该领域中排名靠前的,然后按计划存储。谷歌学者每周只更新几次,这不会是过度使用。在

另一个选择是向google请求许可,这是使用条款中提到的,尽管看起来不太可能被授予。在

相关问题 更多 >