doi搜索和返回元数据

metadata-expander的Python项目详细描述


自动获取元数据条目

此存储库旨在作为从联机站点获取元数据的起点。

它将被集成到colli后端,用于协作文献管理。

安装

必须安装以下软件包:

Python3 美化组4 urllib语言库 python bibtexparser

在ubuntu下安装:

apt install python3 python3-bs4 python3-urllib3 python3-bibtexparser

或者,只需安装python3并通过pip从项目目录中执行其余操作:

pip install -r requirements.txt

添加更多站点。

如果没有特定站点的分析器,则可以在“站点”文件夹中创建它。

命名约定是,该文件中的文件名和类名必须是没有任何子域或顶级域的域名。 所以对于https://dl.acm.org/来说,就是acm

sites/example.py中提供了一个示例

每个类都必须是landingPage的子类,并且可以实现以下函数之一:

defgetBibTeX(self,link,soup):returnNonedefgetDict(self,link,soup):returnNone

在这两种情况下,参数都是doi解析器的登录页的url和被解析为beautifulsoup对象的页。

它们按其返回值分开。

getbibtex必须返回有效的bibtex条目或无。 getdict必须返回一个python字典,其中的字段名符合dublin核心标准。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
Java流收集组合器   文件如何在java中逐个压缩选定的多个文件夹   从Google存储下载数据时发生java SocketTimeoutException   java在安卓应用程序客户端上从python服务器接收值,然后显示与该值对应的mysql数据   数组如何在Java中测试字符串索引是否为Null   java将一串值拆分并放入一个表中   java Spring Memcached注释不缓存   调用pom中设置的环境变量时出现java问题。xml surefire插件   java修复JFrame中重叠的鼠标侦听器   格式化java。sql。日期至yyyyMMdd   java声音剪辑。如果剪辑不正确,isActive应返回true。启动被调用   无根计算机上hadoop中的java格式化namenode   从字符串数组中删除重复项,而无需在Java中进行显式比较   java Eclipse插件安装错误   java webdriver无法在firefox中单击超链接   动画错误。朗。反思。调用目标异常   java试图调用虚拟方法“void”。小装置。编辑文本。在空对象引用上添加TextChangedListener(安卓.text.TextWatcher)”