HGVS变型描述提取器
description-extractor的Python项目详细描述
#HGVS变量描述提取器
明确的序列变量描述在报告中很重要 临床诊断dna检测的结果。标准 人类基因组变异学会(hgvs)的命名法描述了 相对于给定的参考序列观察到的变异序列。 我们提出了一个有效的算法来提取 两个序列中三个主要需求的hgvs描述 注意:最小化结果描述的长度,最小化 计算时间,并保持清晰的描述 具有生物学意义。
该算法能够计算完整的hgvs描述。 染色体或其他大的DNA串 计算时间及其结果描述相对较小。 其他应用包括更新基因变异数据库 内容和参考顺序提升。
>>> from extractor import describe_dna >>> print describe_dna('TAACAATGGAAC', 'TAAACAATTGAA') [3dup;8G>T;12del]
##实施
核心算法在C++中用Python包装提供 开发人员友好的界面。
##安装
###python包
您需要安装[swig](http://www.swig.org/)。然后:
pip install description-extractor
α+c++文库仅
运行make。
也可以设置\u debug\uu标志来跟踪算法。
<>在C/C++环境下直接使用 包括“extractor.h”并将“extractor.cc”添加到项目的 源文件。##测试
python接口有一些单元测试。在安装 python包,使用[pytest](http://pytest.org/)运行它们:
pip install pytest python setup.py develop py.test
或者,使用[tox](https://tox.readthedocs.org/)自动运行 对所有受支持的python版本的测试:
pip install tox tox