genial:幸运生物学家的基因鉴定
GENIALbiologists的Python项目详细描述
genial:幸运生物学家的基因鉴定
作者:Barbet Pauline,Felten Arnaud
隶属关系:Food Safety Laboratory - ANSES Maisons Alfort (France)
您可以在https://github.com/p-barbet/GENIAL找到该工具的最新版本
亲切的
genial的目的是通过ABRicate从细菌基因组中识别出与感兴趣基因数据库相匹配的抗微生物和毒力基因。
数据库
可用的默认数据库是(Resfinder、CARD、ARG-ANNOT、NCBI、EcOH、PlasmidFinder、Ecoli_VF和VFDB)
除了这个数据库之外,还可以使用自己的数据库。
该工具分为两个脚本。
生殖分析
基因分析的目的是消除。它接受输入一个包含基因组fasta文件路径和id的tsv文件,如果你想使用你自己的数据库,你还需要提供一个以基因id为头的multifasta。然后脚本运行abrate并在输出中为每个基因组生成一个abrate结果文件,对应于包含每个样本中发现的基因的tsv文件。
一般结果
genialresults的目的是以存在/不存在的矩阵和热图的形式对结果进行限制。它接受输入一个包含基因组删节结果路径和id的删节分析产生的临时文件。在vfdb数据库的情况下,脚本中自动包含包含毒力因子名称、其家族和物种的文件。
输出取决于使用的数据库:
- 在任何情况下,都会创建TSV格式的矩阵和PNG格式的热图,其中包含找到的所有基因
除此之外:
如果使用默认数据库Resfinder或VFDB中的一个,则按基因类型生成的“新闻矩阵”和“热图”在所有基因组中的基因名称、家族及其编号之间都有相应的表。
如果不使用前两个数据库中的一个,或者使用自己的数据库,则除此之外,只会在所有基因组中的基因名与其编号之间生成一个对应表。
依赖关系
脚本是用python 3.6开发的(用3.6.6测试过)
外部依赖性
参数
命令行选项
Options | Description | Required | Default |
---|---|---|---|
-f | tsv file with FASTA files paths ans strains IDs | Yes | |
-dbp | Path to ABRicate databases repertory. Implies -dbf and --privatedb | Yes if --privatedb | |
-dbf | Multifasta containing the private database sequences. Implies -dbp and --privatedb | Yes if --privatedb | |
-T | Number of thread to use | No | 1 |
-w | Working directory | No | . |
-r | Results directory name | No | ABRicate_results |
--defaultdb | default databases available : resfinder, card, argannot, acoh, ecoli_vf, plasmidfinder, vfdb or ncbi. Incompatible with --privatedb | Yes if not --privatedb | |
--privatedb | Private database name. Implies -dbp and -dbf. Incompatible with --defaultdb | Yes if not --defaultdb | |
--mincov | Minimum proportion of gene covered | No | 80 |
--minid | Minimum proportion of exact nucleotide matches | No | 90 |
--R | Remove genes present in all genomes from the matrix | No | False |
测试
安装abretate、pandas和seaborn后,您可以使用命令行测试脚本:
默认数据库
python AntiViruce.py -f input_file.tsv --defaultdb vfdb -r results_directory --minid 90 --mincov 80
专用数据库
python AntiViruce.py -f input_file.tsv --privatedb private_db_name -T 10 -r results_directory --minid 90 --mincov 80 -dbp path_to_abricate_databases_repertory -dbf private_db_multifasta_path