我是python的新手,需要从科学文献中提取参考资料。下面是我正在使用的代码
from refextract import extract_references_from_file
import pandas as pd
references = extract_references_from_file('1503.07589.pdf')
dfref = pd.DataFrame(references)
dfref.to_excel('./refs.xlsx')
使用此命令一次只能从单个文件中提取引用,但我需要同时从多个文件中提取引用。所以,请指导我是否可能以及如何做到这一点。非常感谢你强>
docs声明提取的引用作为
dict
返回这不太准确,; 返回
dict
的list
, 每个参考文献一本字典因此,您只需建立一个较长的列表
现在你有了一个更大的列表,
references
,你可以把它变成一个更大的df
您可能还发现glob很方便:
相关问题 更多 >
编程相关推荐