一组帮助函数,用于处理sra中的生物元数据。
biometalib的Python项目详细描述
#生物金属库
biometalib是一组用于处理sra生物元数据的有用库和工具。
##安装
这个库是为python 3+设计的,可以用pip或conda安装。
###点
biometalib可以使用pip安装。
`bash pip install -y biometalib `
或者最新版本可以由pip安装。
`bash pip install git+https://github.com/jfear/sramongo pip install git+https://github.com/jfear/biometalib `
###康达[建议]
我建议,首先要确保你有一个能工作的水蟒装置。 [微秒](https://conda.io/miniconda.html)。
`bash conda install -c jfear biometalib `
##属性选择器
属性选择器是一个帮助脚本,用于选择所需的属性 专注于一个项目用户提交的生物元数据包含 各种不同类型的属性。有时这些包括 拼写错误或单词的不同形式,它还包括 对单个项目来说是独一无二的。这个工具是用来快速地处理这些 柱。属性选择器使用格式化文件存储属性 决定。
在yaml文件中,selected attributes将是键。合并时 将多个属性存储到单个选定属性中 价值观。例如:
` sex: - sex - Sex - gender `
这里,selected属性sex具有属性sex和gender 与之相关。还有一个特殊的selected属性ignore将存储一个列表 要忽略的属性。
使用biosample选择表,我创建了一个可以 运行属性选择器时使用。
要在biometa数据库的公共版本上运行属性选择器,请键入:
`bash # Download example YAML $ wget -O my_attribute_selection.yaml https://raw.githubusercontent.com/jfear/biometalib/master/data/flybase_example.yaml $ attribute_selector --host mongo.geneticsunderground.com --port 27022 --db sra --username sra --password oliver --authenticationDatabaseuser-data--config my_attribute_selection.yaml `
属性选择器是一个交互式命令行工具。整体迭代 属性列名尚未选定的属性 亚姆。当前属性显示为红色。在提示下,您可以键入:
- k将当前属性设置为selected属性[保留]
- r要重命名当前属性,将当前属性设置为 重命名的selected属性的值[重命名]
- i将当前属性添加到忽略列表[忽略]
- e显示当前属性下列出的示例值[示例]
- s显示具有相似名称的属性(模糊字符串匹配)。这里选定的属性将显示为黄色[类似]
- n跳过并转到下一个属性[下一个] < < > > >退出>退出程序,但保存进度。