命令行工具,以加快对变量调用格式(VCF)文件的分析。
jacquard的Python项目详细描述
一套命令行工具,用于加速分析来自 多个病人和多个不同的呼叫者。
官方存储库位于:
https://github.com/umich-brcf-bioinf/Jacquard
用法
$ jacquard <subcommand> [options] [arguments]
子命令
translate: | Creates new VCFs, adding a controlled vocabulary of new FORMAT tags. |
---|---|
merge: | Integrates a directory of VCFs into a single VCF. |
summarize: | Adds new INFO fields and FORMAT tags that combine variant data from the merged VCF. |
expand: | Explodes a VCF file into a tab-delimited file. |
有关特定子命令的帮助:
$ jacquard <subcommand> --help
有关完整文档,请参见ReadTheDocs。
通过电子邮件bfx-jacquard@umich.edu获取支持和问题。
um brcf生物信息学核心
安装Jaquard
Jacquard已经在Windows7、OSX和*nix上用Python 2.7和3.4进行了测试
先决条件
注意
pip安装所有必需的库;请参阅下面的[安装]。
- NatSort(3.5.2)
- 运行时需要进行前端测试、测试夹具(3.0.2)和numpy(>;=1.7.1) 自动化测试
安装
安装提花机最简单的方法是通过PyPI如果是皮普 在您的系统中不可用:
$ pip install jacquard
您可以从github的源代码安装:
$ pip install git+https://github.com/umich-brcf-bioinf/Jacquard
如果您没有根权限,可以在本地安装:
$ pip install --user jacquard
注意
您可能需要修改路径以包含python install dir (例如/users/<;username>;/.local/bin)
变更日志
1.1.2(2019年11月7日)
- 调整VCF处理以正确填充可选的尾部格式字段
- 调整了mutect转换以在filtermutectcalls时将pass视为体传递 出现在元标题中
1.1.1(2018年10月30日)
- 将静音转换器调整为:
- 分析样本元标题中的正常和肿瘤名称(如果可用)
- 识别更多的互斥元标题格式变体
1.1.0(2018年6月18日)
- 调整了translate以正确分析更新版本的mutect
- 更新了mutect、strelka、varscan支持的版本
- 修正了JQ_SUMMARY_DP_AVERAGE标记描述中的错误
1.0.0(2018年5月6日)
- 删除了过时的峰值目录
- 修正了expand中可能覆盖固定vcf字段(例如ref,alt, 如果信息中的字段名称相同。
- 切换到语义版本控制
0.42(2015年9月22日)
- 在readthedocs中添加了文档
- 使用示例数据改进工作流文档
- Merge现在将消除来自多个vc的标记冲突的歧义
- Translate/summary现在支持GT标记
- 将精度扩展到小数点后4位,以支持基因面板的分析。
- 调整翻译以处理空的高置信度varscan文件。
0.41(2015年7月5日)
- Combined filter command with merge command
- Extended expand to create simple metaheader glossary
- Adjusted code to support Python >=2.7 or 3.x
- Improved checks for consistent VCF file sets
- Fixed bug in merge that caused error if any VCFs were unsorted
- Fixed bug in summarize that caused error if variant was called by subset of callers
0.31(2015年3月17日)
- Downgraded VCF format from 4.2 to 4.1
- Fixed a bug that omitted CALLERS_REPORTED_LIST summary tag
- Simplified summary tags; removed dependency on numpy
- Adjusted VarScan translation to accept a file pattern to identify high-confidence files
0.3(2015年3月9日)
- Replaced normalize, tag commands with translate; relaxed constraints on incoming data.
- Renamed consensus to summarize
- More consistent behavior in expand
- Significantly improved merge performance
- Added new summary tags:
- CALLERS_REPORTED_COUNT
- CALLERS_REPORTED_LIST
- SAMPLES_REPORTED_COUNT
- CALLERS_PASSED_COUNT
- CALLERS_PASSED_LIST
- SAMPLES_PASSED_COUNT
- Fixed bug in how Strelka calculated AF on indels
- Improved command validation and error handling
- Added project/code documentation
- Removed dependencies on pandas
0.21(2014年10月)
- Initial public release
提花是由密歇根大学编写和维护的 brcf生物信息核心;个人贡献者包括:
- 杰西卡·贝尼
- 阿什维尼·巴西
- 克里斯·盖茨
- 迪维娅·克里蒂
- 孟凯文
- 彼得·乌林茨