爆炸读取和otu一致性分类器
brocc的Python项目详细描述
brocc
从blast结果生成基于一致性的分类分配。
使用brocc时请引用以下文件:
Dollive S、Peterfreund GL、Sherrill Mix S、Bittinger K、Sinha R、Hoffmann C、Nabel CS、Hill DA、Artis D、Bachman MA、Custers Allen R、Grunberg S、Wu GD、Lewis JD、Bushman FD。一个用于从人类微生物群样本中定量真核rrna基因序列的工具包。基因组生物学。2012年7月3日;13(7):R60。doi:10.1186/gb-2012-13-7-r60。
安装
要安装brocc,请在当前目录中运行此命令。
pip install .
brocc有两种查找分类单元名称的方法:它可以使用 ncbi分类法的副本,或者它可以使用ncbi的e-utilities来请求 网络上的名字。使用ncbi分类法的本地副本很重要 更快更可靠。要准备此分类数据库,请使用 命令:
create_local_taxonomy_db.py
分类数据库需要大约5g,存储在
~/.brocc/taxonomy.db
默认情况下。
运行
brocc分类器使用输出格式将blast结果作为输入 7(见爆破文件)。以下爆破参数为 发现最适合基于振幅的序列集:
blastn -query <SEQUENCES (FASTA FORMAT)> -evalue 1e-5 -outfmt 7 -db nt -out <BLAST RESULTS> -num_threads 8 -max_target_seqs 100
brocc程序需要两个输入文件和一个输出目录的名称:
brocc.py -i <SEQUENCES (FASTA FORMAT)> -b <BLAST RESULTS> -o <OUTPUT DIRECTORY>
brocc.py
输出一个qiime格式的分类法映射和一些日志
提供投票细节的文件。
设置
brocc命令有几个共识形成选项:
- 最低命中率(供考虑)
- 最小物种身份(在物种层面考虑)
- 最小属同一性(供属级考虑)
当前为its1基因设置了默认值,因为 设置似乎在几个不同的放大器上工作得很好。这个 ITS1在物种水平上的最小身份默认值为95.2%,并且 属级83.05%(取自liggenstoffer等人)。18秒, 物种级设置为99.0%,属级设置为96.0% 似乎产生了最准确和稳定的任务。