基于ExeTera的Covid症状研究分析

exeteracovid的Python项目详细描述


埃塞特拉科维奇

欢迎使用ExeTeraCovid自述!在

电流释放v0.2.0.1

本页和随附的wiki向您展示了如何使用ExeTera为Covid症状研究数据集创建可重复的分析管道。在

这个项目包含一套笔记本,脚本和算法,帮助你分析和写新的分析,为Covid症状研究数据。 ExeTera是伦敦国王学院开发的一个软件,为Covid症状研究数据集提供数据管理。数据集使用佐伊全球有限公司开发的Covid症状研究应用程序收集,输入来自伦敦国王学院、麻省总医院、瑞典隆德大学和瑞典乌普萨拉大学。 此项目包含以下内容:

  • Notebooks:包含准备运行分析的Python笔记本
  • Scripts:包含准备运行分析的Python脚本
  • Algorithms:用于清理/处理Covid症状研究数据的许多有用算法,可在您自己的脚本中使用
  • Processing:许多有用的功能,可以在您自己的脚本中使用

运行分析

运行分析是一个简单的过程:

  1. 获取数据集快照
  2. 使用exetera import导入数据集
  3. 通过笔记本或脚本对导入的数据集运行后处理脚本
  4. 运行分析!在

获取数据集快照

Covid症状研究以一系列每日csv快照的形式提供。如果作为研究机构,您无法访问快照,可以从The Health Data Gateway获取快照。在

导入数据集

导入数据集需要以下操作:

  • 数据快照
  • 可在此项目中找到的数据集covid_schema.json的架构文件
  • ExeTera,可以使用命令pip install ExeTera进行安装
exetera import
-s path/to/covid_schema.json \
-i "patients:path/to/patient_data.csv, assessments:path/to/assessmentdata.csv, tests:path/to/covid_test_data.csv, diet:path/to/diet_study_data.csv" \
-o path/to/output_dataset_name.hdf5

对导入的数据集运行后处理脚本

这可以通过以下两种方法之一进行:

  • 通过python笔记本使用exeteracovid/notebooks/standard_processing.ipynb
  • 通过python脚本使用exeteracovid/scripts/standard_processing.py

通过python笔记本

填写input_filenameoutput_filename的字段,然后运行单元格

通过python脚本

^{pr2}$

参数

  • -i/--input:导入hdf5文件的路径和名称
  • -o/--output:处理的hdf5文件的路径和名称
  • -d/--daily:指示是否生成每日评估的标志(可选)

政府开放牌照v3.0归属声明

除其他资源外,resources文件夹还包含CSV文件,其中包含某些脚本所需的lsoa11cd地理数据,这些数据源来自https://data.gov.uk提供的数据源。这些源是根据Open Government Licence V3.0使用的

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
我可以用C++代码使用java代码吗?   java使用JSR303在派生类中提供更具体的约束   java在这个查找唯一路径数算法中我做错了什么?   java如何为2个不同的服务提供商使用2个不同的SSL证书?   java在Gridview上绘制文本   java使用连接for循环构建字符串名   java StringBuilder拆分无法处理某些文件   java事件关注EditText   Java Web Start“找不到URL的缓存资源”   java程序从命令行运行的速度比在Eclipse中慢   java为什么HttpServletRequest会截断#字符上的url输入?   java自定义折叠工具栏平滑标题大小调整   使用Mockito对安卓 java中调用另一个静态函数的函数进行单元测试   http在java客户机中使用cachecontrol头   java如何使用。是否使用Delimiter从输入文件中排除标点符号和数字?   使用上下文作为参数/参数的java   java更有效地从Jar中提取文件   java为多个JButton提供相同的actionListener