ambivert-振幅合并错误截断的变量调用者。在基于扩增子的测序实验中调用变体

ambivert的Python项目详细描述


ambivert的实验α释放
----------


此程序设计用于处理在第二代测序平台(如illumina hiseq/miseq)上生成的基于振幅的重排序数据。在将序列与参考基因组对齐之前,将每个扩增子在
聚类步骤中一起导出。


步骤:
1)聚类相似的读取
2)对齐重叠
3)对齐参考目标序列
4)合并调用
5)输出vcfMat Calls



由Matthew Wakefield和Graham Taylor创建。
版权所有(C)2013 Matthew Wakefield和墨尔本大学。保留所有权利。

$ambivert--help
用法:ambivert[-h][-f forward][-r reverse][-m manifest][-fasta fasta]
[-output output][-countfile countfile]
[-threshold threshold][-min-cover min-cover]
[-min-reads min-reads][--min_freq min_freq]
[--overlap overlap][--hashtable hashtable]
[--savehashtable savehashtable][--alignments alignments]
[--prefix prefix]

ambivert:一个对amplicon数据ambivert集群进行二进制分析的程序
ident基于读取频率的iCal放大器序列和阈值,以消除
技术错误。由于与低频变量相比,出现的排序错误具有更随机的
分布,这种方法减少了必须分配给目标区域的
扩增子产品的数量,并评估了
变量调用。ambivert向前和反向重叠从同一个放大器中读取,并保留本地相位信息。首次使用
的典型运行时间为几个小时,当提供上次运行时计算的
哈希表以分析具有相同放大倍数的后续
样本时,该时间减少到10分钟以内。

sage和exit
-f forward,--forward forward
读取正向放大器的fastq格式文件。可以用带有
适当后缀(.gz)
-r reverse,--reverse reverse
的gzip压缩反向振幅
读取的fastq格式文件。可以使用带有适当后缀(.gz)
-m manifest,--manifest manifest
illumina trueseq amplicon manifest文件的gzip压缩。
--fasta fasta一个fasta amplicon manifest文件。序列应限制在要调用的区域内,不包括引物和适配器。此文件可以在
添加到illumina清单中提供,以指定其他
非目标区域。
--与变量对齐的输出输出。默认值:stdout
--countfile countfile
输出每个放大器的发生计数。包括映射到参考振幅的所有
计数。此计数
不包括频率
低于最小出现阈值--threshold<;default=20>;
--threshold threshold
时发生的读取。忽略出现次数小于阈值
的唯一振幅
序列变体。默认值20
--最小覆盖最小覆盖
调用变量所需的站点的最小覆盖。此参数仅在其为>;
阈值时才有效。默认值0
--最小读取最小读取
包含调用变量所需的读取数
的最小变量数。此参数仅在其为阈值时才具有
效果。默认值0
--min_freq min_freq变异读取的最小比例。默认值为0.1
(百分之十)
--重叠-要合并的正向和反向序列之间所需的最小重叠。默认值为20bp
--哈希表哈希表
文件名,用于预先计算的哈希表,该哈希表与引用的振幅
完全匹配。使用
--savehashtable
--savehashtable savehashtable
生成一个与引用完全匹配的预计算哈希表。用于加快与
--hashtable
--alignments alignments
的匹配将包含
对齐的变量的格式化文本版本打印到文件。"-"将打印到stderr
--前缀前缀--正向,-反向,
--计数文件和--outfile的简写规范。--forward=
<;prefix>;\u r1.fastq.gz--reverse=<;prefix>;\u r2.fastq.gz
--outfile=<;prefix>;.vcf--countfile=<;prefix>;.counts




-------


用法:simulate_variants[-h][--manifest manifest][--fasta fasta]
[--read1 read1][--read2 read2][--skip_softmasked]
[--position_excludes_softmasked]
[--deletions deletions][--check_sam check_sam]

simula从Amplicon目标
文件


可选参数:
-h,--帮助显示此帮助消息并退出
--清单清单清单Illumina TrueSeq Amplicon清单文件。默认值:
none
--fasta fasta扩增子的fasta文件全部位于正链
带描述行的方向">;命名染色体
开始-结束"默认值:none
--read1 read1转发读取的fastq输出文件。默认值:stdout
--read2 read2反向读取的fastq输出文件。默认值:stdout
--跳过软屏蔽不在软屏蔽序列中生成变量。
默认值:true
--位置不包括软屏蔽
计算读取、雪茄和变量检测字符串的开始位置时不包括软屏蔽序列。
默认值:true
--deletions deletions
要插入的大小删除,而不是point
变量。默认值:none
--check_sam check_sam
用于分析的sam文件,以标识名称
与sam文件映射位置和变量字符串不匹配的条目


truseq_manifest
----

用法:truseq_manifest[-h][--manifest manifest][--输出输出][--probes]
[--适配器][--with_probes][--softmask_probes]
[--all_plus]

由修剪程序(例如Nesoni剪辑)使用

ST文件。默认值:
stdin
--输出序列目标的多个fasta输出文件。默认值:
stdout
--探针仅输出ULSO和DLSO引物序列
--适配器将Illumina适配器序列附加到引物
序列
--使用_探针将ULSO和DLSO序列附加到Fasta-target
序列
--软掩模探针将ulso和dlso序列附加到fasta-target
序列
--all-plus重定向目标序列,因此它们都出现在plus链上

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
用户界面如何在JavaGUI中为按钮创建各种颜色?   使用MSCAPI的RSA密钥包装的java使用   java Spring数据Redis JedisConnectionException:意外的流结束   java饼图未显示预期输出   java hystrixCommand注释commandKey的用途是什么   windows java可以从cmd运行jar,但不能通过双击来运行   java在单击按钮时遍历XML节点   java试图使用日期(int,int,int)构造函数   带有Buildship 2子项目的java不作为项目依赖项链接   java jsonrpc4j:如何从服务器获取列表<SomeObject>?   用于Java应用程序的内存设置MaxDirectMemory和MaxHeapMemory   java如何从以下类型格式化日期   javayoutube。搜索列表搜索不返回任何内容   java My参数在方法中不起作用,因为泛型存在问题   java如何将Map<Key1Type,Val1Type>转换为Map<Key1Type,Val2Type>   JavaJUnit测试:测试用例的改进,测试数组列表的长度?   java如何在Android中解析带有属性值的xml数据?   使用Hibernate对枚举类型进行Java8bean验证