用于处理病毒rna-ngs数据的脚本集合。
smallgenomeutilities的Python项目详细描述
smallgenomeutilities是一个脚本集合,用于处理和操作小病毒基因组的ngs数据。它们是用python 3编写的,具有少量的依赖项。
依赖关系
- 生物圈
- 努比
- 进度
- 皮萨姆
- sklearn
- matplotlib
安装
安装smallgenomeutilities的推荐方法是使用pip:
pip install smallgenomeutilities
实用程序说明
计算MDS
计算多维标度以可视化重建单倍型之间的距离。
转换qr
将发送者和接收者的单倍型集的准irecomb输出转换为组合的单倍型集,其中已过滤间隙。选择性地翻译成肽序列。
转换参考
进行基因组提升。将sam或bam格式的对齐从一个引用序列转换为另一个引用序列。可以用=/x替换m状态。
覆盖范围
计算不同控件上目标区域的平均覆盖率。
覆盖率统计
计算路线目标区域的平均覆盖率。
提取覆盖率间隔
提取具有足够覆盖率的区域以运行shorah。返回半开区间,[开始:结束],使用基于0的索引。
摘录
提取比对的子序列,并选择将其转换为肽序列。可根据子序列频率或子序列中的间隔频率进行滤波。
摘录
将对齐序列提取到fasta文件中,其中序列id与给定字符串匹配。
制图员
在给定初始对照和偏移量的情况下,确定目标对照的基因组偏移量。可用于绘制参考基因组之间的图谱。
少数民族频率
从多个样本中提取少数变异的频率。还支持一个感兴趣的地区。
配对序列
比较来自发送者和接收者样本的多序列比对序列,以确定发送者与接收者的最佳匹配。
预测读数
预测质量预处理后的读取数。
消除间隙
给定多序列比对,移除间隙分数高于某个阈值的轨迹。
贡献
- 大卫·塞弗特,david.seifert@bsse.ethz.ch>;
- 苏珊娜·波萨达·塞斯佩德斯,susana.posada@bsse.ethz.ch>;