巨蟒生物信息学工具包(蛋白质分类)。
cathp的Python项目详细描述
导管
cathpy
是一个用python编写的生物信息学工具包。它是由
Orengo Group位于UCL,用于维护CATH protein structure database(以及相关的研究)。
开始
使用此代码的最简单方法是通过pip
:
$ python3 -m venv venv
$ source venv/bin/activate
$ pip install cathpy
如果所有部件都已安装并正常工作,则以下各项应正常工作:
$ cath-align-summary -d tests/data/funfams/ file aln_len seq_count dops gap_per tests/data/funfams/1.10.8.10-ff-14534.reduced.sto 695161.53 12.53 tests/data/funfams/1.10.8.10-ff-15516.reduced.sto 66429100.00 13.04 tests/data/funfams/1.10.8.10-ff-5069.reduced.sto 59147.81 3.15 tests/data/funfams/1.10.8.10-ff-15593.reduced.sto 6320395.88 17.70
现在去have a look at the documentation。
贡献
有很多方法可以做出贡献,所有这些都是最受欢迎的。
- 如果有些东西不清楚,那么您已经在文档中发现了一个缺口,请通过raising a new issue
- 如果看起来你应该能够做一些你不能做的事情,那么你要么已经确定了一个新的功能请求,要么就是一个文档缺口-请通过raising a new issue
- 如果您注意到一些意想不到的行为,您可能发现了一个错误-请通过raising a new issue
当你提出一个问题时,如果你首先检查一个类似的问题还没有被注册,这是非常有帮助的。如果你能尽可能清晰、简洁和具体,那也会很好。如果您正在报告一个潜在的错误,请尝试提供步骤,使我们能够重现意外行为。
如果您的问题附带一个pull请求,该请求实际上解决了文档/功能请求/错误修复,那么您很可能有资格使用甜甜圈。
开发
如果您正在开发,则这是一般建议的流程:
访问最新版本的代码并创建一个新分支(带有新功能/错误修复的描述性摘要):
$ git clone git@github.com:UCL/cathpy.git
$ cd cathpy
$ git checkout -b my-awesome-new-feature
将代码(作为可编辑包)安装到虚拟环境中
$ python3 -m venv venv
$ source venv/bin/activate
$ pip install -e .
编写测试,进行更改,然后确保测试(以及所有其他测试)仍然通过:
$ vim tests/my_new_feature_test.py $ vim cathpy/my_new_feature.py $ pytest
然后将更改推回到github,并通过web页面发出pull请求。
$ git push
常见问题解答
什么是cathpy?
cathpy
是一个包含生物信息学工具和库的python包
用于CATH(ucl的蛋白质结构分类资源)。
hmmm.。听起来像是另一个python生物信息学工具包?
是的……某种程度上。
我应该使用它吗?
如果您正在寻找一个通用的生物信息学工具包,您应该首先查看BioPython。
cathpy
项目确实包含一些可能与biopython重叠的通用功能,
不过,我们绝对不会试图重写这个库。它主要是为
内部使用(在cath中),但是它已经作为开源发布,以防其他人发现这些工具有帮助。
外部软件
此代码库包含作者未编写和维护的外部工具 这个项目的。如果您使用这些工具的结果,请参考相关论文。
组SIM
蛋白质功能特异性残基的表征和预测。
capra ja和singh m(2008年)。
生物信息学,24(13):1473-1480,2008年。
记分卡
记分残留物保存。
valdar wsj(2002年)
蛋白质:结构、功能和遗传学。43(2):227-2412002年。
参考文献
描述cath蛋白结构数据库的最新论文:
cath:扩展基因组序列基于结构的功能注释的视野。
sillitoe I等人(2018年)
核酸研究,第47卷,第d1期,2019年1月8日,第d280-d284页,https://doi.org/10.1093/nar/gky1097