细菌组合中感兴趣基因(goi)存在的筛选
read-overlap的Python项目详细描述
屏幕部件
在细菌集合中筛选感兴趣基因(goi)存在的管道。生成多个csv和描述哪些基因存在以及它们的序列如何变化的图。可以使用dna或蛋白质查询序列(gois)和dna contigs/fastas或蛋白质fastas作为数据库(db)进行搜索。
开始
您需要一个fasta文件,其中包含所有gois作为查询,以及一个包含db contigs/fastas的文件夹。数据库文件的名称中只能有一个“.”(即sample_1.fa而不是sample.1.fa)
先决条件
必需的
python 3和scypi/biopython 命令行爆炸
可选
欧米茄俱乐部, raxml和/或iqtree
安装
- 下载screen_assembly3.py脚本并将其放置在您的路径中:
- git克隆https://github.com/shimbalama/screen_assembly.git
- 确保其可执行文件(chmod+x screen_assembly/screen_assembly3.py)
- export path=“您的路径:$path”(命令pwd将给出您的路径)
- 最好通过将其添加到.bash_profile(Mac)或.profile(Unix)将其永久添加到您的路径中
- 下载lab_modules.py:
- git克隆https://github.com/shimbalama/common_modules.git
- 确保其可执行文件(chmod+x common_modules/lab_modules.py)
- export pythonpath=“您的路径:$pythonpath”
- 最好通过将其添加到.bash_profile(Mac)或.profile(Unix)将其永久添加到您的路径中
- 将common_modules文件夹放在screen_assembly文件夹旁边(默认情况下是这个文件夹)。或者使用文本编辑器将screen_assembly3.py中的此行设置为指向lab_modules.py所在的目录:sys.path.append('../common_modules')变为sys.path.append('your_path/common_modules')
检查更新
- Git拉动
运行测试
一旦screen_assembly3.py位于路径类型screen_assembly3.py-h中。如果您拥有所有依赖项,则将显示“帮助”菜单。否则,请读取ERORR并安装缺少的依赖项。
运行程序
请查看wiki
作者
- liam mcintyre-初始工作-https://github.com/shimbalama/
许可证
这个项目是在麻省理工学院的许可下授权的-详细信息请参见许可https://github.com/shimbalama/screen_assembly/blob/master/LICENSE文件
致谢
- 马克·戴维斯实验室和杰克进行测试