基于ExeTera的Covid症状研究分析
exeteracovid的Python项目详细描述
埃塞特拉科维奇
欢迎使用ExeTeraCovid自述!在
电流释放v0.2.0.1
本页和随附的wiki向您展示了如何使用ExeTera为Covid症状研究数据集创建可重复的分析管道。在
这个项目包含一套笔记本,脚本和算法,帮助你分析和写新的分析,为Covid症状研究数据。 ExeTera是伦敦国王学院开发的一个软件,为Covid症状研究数据集提供数据管理。数据集使用佐伊全球有限公司开发的Covid症状研究应用程序收集,输入来自伦敦国王学院、麻省总医院、瑞典隆德大学和瑞典乌普萨拉大学。 此项目包含以下内容:
- Notebooks:包含准备运行分析的Python笔记本
- Scripts:包含准备运行分析的Python脚本
- Algorithms:用于清理/处理Covid症状研究数据的许多有用算法,可在您自己的脚本中使用
- Processing:许多有用的功能,可以在您自己的脚本中使用
运行分析
运行分析是一个简单的过程:
- 获取数据集快照
- 使用
exetera import
导入数据集 - 通过笔记本或脚本对导入的数据集运行后处理脚本
- 运行分析!在
获取数据集快照
Covid症状研究以一系列每日csv快照的形式提供。如果作为研究机构,您无法访问快照,可以从The Health Data Gateway获取快照。在
导入数据集
导入数据集需要以下操作:
- 数据快照
- 可在此项目中找到的数据集
covid_schema.json
的架构文件 - ExeTera,可以使用命令
pip install ExeTera
进行安装
exetera import
-s path/to/covid_schema.json \
-i "patients:path/to/patient_data.csv, assessments:path/to/assessmentdata.csv, tests:path/to/covid_test_data.csv, diet:path/to/diet_study_data.csv" \
-o path/to/output_dataset_name.hdf5
对导入的数据集运行后处理脚本
这可以通过以下两种方法之一进行:
- 通过python笔记本使用
exeteracovid/notebooks/standard_processing.ipynb
- 通过python脚本使用
exeteracovid/scripts/standard_processing.py
通过python笔记本
填写input_filename
和output_filename
的字段,然后运行单元格
通过python脚本
^{pr2}$参数
-i/--input
:导入hdf5文件的路径和名称-o/--output
:处理的hdf5文件的路径和名称-d/--daily
:指示是否生成每日评估的标志(可选)
政府开放牌照v3.0归属声明
除其他资源外,resources文件夹还包含CSV文件,其中包含某些脚本所需的lsoa11cd地理数据,这些数据源来自https://data.gov.uk提供的数据源。这些源是根据Open Government Licence V3.0使用的
- 项目
标签: