爆炸读取和otu一致性分类器

brocc的Python项目详细描述


brocc

从blast结果生成基于一致性的分类分配。

使用brocc时请引用以下文件:

Dollive S、Peterfreund GL、Sherrill Mix S、Bittinger K、Sinha R、Hoffmann C、Nabel CS、Hill DA、Artis D、Bachman MA、Custers Allen R、Grunberg S、Wu GD、Lewis JD、Bushman FD。一个用于从人类微生物群样本中定量真核rrna基因序列的工具包。基因组生物学。2012年7月3日;13(7):R60。doi:10.1186/gb-2012-13-7-r60。

安装

要安装brocc,请在当前目录中运行此命令。

pip install .

brocc有两种查找分类单元名称的方法:它可以使用 ncbi分类法的副本,或者它可以使用ncbi的e-utilities来请求 网络上的名字。使用ncbi分类法的本地副本很重要 更快更可靠。要准备此分类数据库,请使用 命令:

create_local_taxonomy_db.py

分类数据库需要大约5g,存储在 ~/.brocc/taxonomy.db默认情况下。

运行

brocc分类器使用输出格式将blast结果作为输入 7(见爆破文件)。以下爆破参数为 发现最适合基于振幅的序列集:

blastn -query <SEQUENCES (FASTA FORMAT)> -evalue 1e-5 -outfmt 7 -db nt -out <BLAST RESULTS> -num_threads 8 -max_target_seqs 100

brocc程序需要两个输入文件和一个输出目录的名称:

brocc.py -i <SEQUENCES (FASTA FORMAT)> -b <BLAST RESULTS> -o <OUTPUT DIRECTORY>

brocc.py输出一个qiime格式的分类法映射和一些日志 提供投票细节的文件。

设置

brocc命令有几个共识形成选项:

  • 最低命中率(供考虑)
  • 最小物种身份(在物种层面考虑)
  • 最小属同一性(供属级考虑)

当前为its1基因设置了默认值,因为 设置似乎在几个不同的放大器上工作得很好。这个 ITS1在物种水平上的最小身份默认值为95.2%,并且 属级83.05%(取自liggenstoffer等人)。18秒, 物种级设置为99.0%,属级设置为96.0% 似乎产生了最准确和稳定的任务。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java如何通过弹出消息或警报对话框验证多个edittext字段?   九人莫里斯游戏的java比特板表示法   java处理:如何阻止所有侦听器捕获鼠标事件   selenium我无法单击元素,没有错误WebDriver/Java/Firefox   多线程Java ReentrantLock,无法解锁锁   java将数据发送到Wampserver Android   Java 2D阵列和扫描仪   java在使用apache commons csv读取csv文件时跳过双引号   java Liberty Buildpack在部署War时偶尔暂停/冻结   java JavaFX日期选择器未更新值   java如何获取移动电话的公共IP地址?   java Mockito检查对象上是否调用了任何方法(对象已被访问)   java这个maven认证错误表明了什么?   java如何使用特殊字体(单元格中的文本以粗体、下划线甚至不同的字体颜色)添加到Jtable?   实例化可以是具体类或接口类的Java类   Java准备语句的Oracle错误“SQL命令未正确结束”(ORA0033)