我有以下谷歌学者论文的作者名单:Zoe Pikramenou, James H. R. Tucker, Alison Rodger, Timothy Dafforn
。我想提取并打印至少三篇论文的标题
您可以使用学术词典从每位作者处获取论文信息:
from scholarly import scholarly
AuthorList = ['Zoe Pikramenou', 'James H. R. Tucker', 'Alison Rodger', 'Timothy Dafforn']
for Author in AuthorList:
search_query = scholarly.search_author(Author)
author = next(search_query).fill()
print(author)
输出看起来有点像(只是从一位作者那里得到的一个小摘录)
{'bib': {'cites': '69',
'title': 'Chalearn looking at people and faces of the world: Face '
'analysis workshop and challenge 2016',
'year': '2016'},
'filled': False,
'id_citations': 'ZhUEBpsAAAAJ:_FxGoFyzp5QC',
'source': 'citations'},
{'bib': {'cites': '21',
'title': 'The NoXi database: multimodal recordings of mediated '
'novice-expert interactions',
'year': '2017'},
'filled': False,
'id_citations': 'ZhUEBpsAAAAJ:0EnyYjriUFMC',
'source': 'citations'},
{'bib': {'cites': '11',
'title': 'Automatic habitat classification using image analysis and '
'random forest',
'year': '2014'},
'filled': False,
'id_citations': 'ZhUEBpsAAAAJ:qjMakFHDy7sC',
'source': 'citations'},
{'bib': {'cites': '10',
'title': 'AutoRoot: open-source software employing a novel image '
'analysis approach to support fully-automated plant '
'phenotyping',
'year': '2017'},
'filled': False,
'id_citations': 'ZhUEBpsAAAAJ:hqOjcs7Dif8C',
'source': 'citations'}
我如何收集四位作者中三位或三位以上的论文的bib
,特别是title
编辑:事实上,有人指出id_citations
并不是每一篇论文都是唯一的,我错了。最好只使用title
本身
扩展我的评论,您可以使用Pandas groupby实现这一点:
这发现了202篇论文,其中有2位或更多的作者在该列表中(在774篇论文中)。以下是一个输出示例:
由于所有数据都在Pandas中,因此您还可以探索每篇论文的附加作者是什么,以及您可以在来自学术界的
author.publications
数组中访问的所有其他信息首先,让我们将其转换为更友好的格式。您说
id_citations
对于每篇论文都是唯一的,所以我们将使用它作为哈希表/dict键然后,我们可以将每个
id_citation
映射到它显示的bib dict和作者,作为元组列表(bib, author_name)
此后,我们可以根据附加到
bibs
中的作者数量对键进行排序:和/或将该列表筛选为只有三个或更多外观的引用:
现在我们可以从那里检索论文的标题:
相关问题 更多 >
编程相关推荐