从远程档案中检索数据的工具
advarchs的Python项目详细描述
概述
advarchs是从web档案中检索数据的简单工具。 如果您正在处理压缩文件中存储的远程数据,则它特别有用 电子表格或类似格式。
开始
假设您需要在excel电子表格上执行一些数据分析 每月刷新并以rar格式存储。你可以瞄准那个文件 并使用以下过程将其转换为pandas数据帧:
importpdimportosimporttempfilefromadvarchsimportwebfilename,extract_web_archiveTEMP_DIR=tempfile.gettempdir()url="http://www.site.com/archive.rar"arch_file_name=webfilename(url)arch_path=os.path.join(TEMP_DIR,arch_file_name)xlsx_files=extract_web_archive(url,arch_path,ffilter=['xlsx'])forxlsx_finxlsx_files:xlsx=pd.ExcelFile(xlspath)...
要求
- Python3.5+
- 已安装7Z实用程序
安装
pip install advarchs