vdj分配和抗体序列注释。可从单个序列扩展到数十亿个序列。
abstar的Python项目详细描述
啊![](https://img.shields.io/pypi/v/abstar.svg?colorB=blue) [![生成状态](https://travis-ci.com/briney/abstar.svg?branch=master)](https://travis-ci.com/briney/abstar) [![文档状态](https://readthedocs.org/projects/abstar/badge/?version=latest)](https://abstar.readthedocs.io/en/latest/?徽章=最新) 啊![](https://img.shields.io/pypi/pyversions/abstar.svg) 啊![](https://img.shields.io/badge/license-MIT-blue.svg)
#文章摘要
vdj分配和抗体序列注释。可从单个序列扩展到数十亿个序列。
- Source code: [github.com/briney/abstar](https://github.com/briney/abstar)
- Documentation: [abstar.readthedocs.org](http://abstar.readthedocs.org)
- Download: [pypi.python.org/pypi/abstar](https://pypi.python.org/pypi/abstar)
- Docker: [hub.docker.com/r/briney/abstar/](https://hub.docker.com/r/briney/abstar/)
###安装 pip install abstar
###使用
要在单个fasta或fastq文件上运行abstar: abstar -i<input-file>-o<output-directory>-t<temp-directory>
要对输入目录中的所有文件迭代运行abstar,请执行以下操作: abstar -i<input-directory>-o<output-directory>-t<temp-directory>
要使用包含的测试数据作为输入运行ABSTAR: abstar -o<output-directory>-t<temp-directory>--use-test-data
当使用Abstar测试数据时,注意尽管测试数据文件包含1000个序列,但其中一个测试序列不是有效的抗体重组。只应成功处理999个序列。
使用basespace作为输入数据源时,可以选择提供所有必需的目录: abstar -i<input-directory>-o<output-directory>-t<temp-directory>-b
或者只需提供一个项目目录,所有必需的目录都将在项目目录中创建: abstar -p <project_directory> -b
###其他选项 -l LOG_LOCATION, --log LOG_LOCATION更改日志目录位置。默认为<output_directory>的父目录。
-m,--merge输入目录应包含成对的fastq(或gzip fastq)文件。配对文件将与pandaseq合并,然后再与abstar进行处理。注意,当使用basespace选项(-b,--basespace)时,此选项是隐含的。
-b,--basespace从基础空间(illumina的云存储环境)下载排序运行。由于illumina序列器产生成对的末端读取,因此暗示--merge。
-u N, --uaid N序列包含长度为n的唯一抗体id(uaid,或分子条形码)。uaid将从每个输入序列的开头解析并添加到json输出中。负值会导致从序列末尾解析uaid。
-s SPECIES, --species SPECIES选择从中派生输入序列的种类。支持的选项有“human”、“mouse”和“macake”。默认为“人”。
-c,--cluster在芹菜集群上以分布式模式运行abstar。
-h,--help打印所有运行时选项的详细信息。
-D--debug更详细的日志记录。
###原料药 大多数核心的abstar函数都可以通过一个公共api获得,这使得作为集成分析管道的一个组件运行abstar变得更加容易。有关api的更多详细信息,请参阅abstar[文档](http://abstar.readthedocs.org)。
###帮助程序脚本 Abstar中包括一些帮助脚本: batch_mongoimport自动将多个json输出文件导入mongodb数据库。 build_abstar_germline_db从imgt-gapped-fasta的v、d和j基因片段文件创建abstar-germline数据库。 make_basespace_credfile为basespace生成一个凭据文件,如果使用abstar从basespace下载序列,则需要该文件。开发人员凭据是必需的,获取它们的过程[在这里](https://support.basespace.illumina.com/knowledgebase/articles/403618-python-run-downloader)
###测试 要运行测试套件,请克隆或下载存储库并从顶级目录运行pytest ./。
###要求 Python2.7,3.5+ 阿布蒂尔斯 生物疗法 芹菜 模拟(仅限Python2.7) nwalign3(用于python 2.7的nwalign) 皮蒙戈 比重瓶 scikit bio(对于python 2.7,<;=0.4.2)
以上所有依赖项都可以用pip安装,并在用pip安装abstar时自动安装。 如果您是python新手,一个很好的入门方法是安装[anaconda python发行版](https://www.continuum.io/downloads),其中包括pip以及大量有用的科学python包。
序列合并需要[pandaseq](https://github.com/neufeld/pandaseq) 批处理MongoImport需要[MongoDB](http://www.mongodb.org/) 下载basespace需要[basespace python sdk](https://github.com/basespace/basespace-python-sdk)