vdj分配和抗体序列注释。可从单个序列扩展到数十亿个序列。

abstar的Python项目详细描述


啊![](https://img.shields.io/pypi/v/abstar.svg?colorB=blue) [![生成状态](https://travis-ci.com/briney/abstar.svg?branch=master)](https://travis-ci.com/briney/abstar) [![文档状态](https://readthedocs.org/projects/abstar/badge/?version=latest)](https://abstar.readthedocs.io/en/latest/?徽章=最新) 啊![](https://img.shields.io/pypi/pyversions/abstar.svg) 啊![](https://img.shields.io/badge/license-MIT-blue.svg

#文章摘要

vdj分配和抗体序列注释。可从单个序列扩展到数十亿个序列。

###安装 pip install abstar

###使用

要在单个fasta或fastq文件上运行abstar: abstar -i<input-file>-o<output-directory>-t<temp-directory>

要对输入目录中的所有文件迭代运行abstar,请执行以下操作: abstar -i<input-directory>-o<output-directory>-t<temp-directory>

要使用包含的测试数据作为输入运行ABSTAR: abstar -o<output-directory>-t<temp-directory>--use-test-data

当使用Abstar测试数据时,注意尽管测试数据文件包含1000个序列,但其中一个测试序列不是有效的抗体重组。只应成功处理999个序列。

使用basespace作为输入数据源时,可以选择提供所有必需的目录: abstar -i<input-directory>-o<output-directory>-t<temp-directory>-b

或者只需提供一个项目目录,所有必需的目录都将在项目目录中创建: abstar -p <project_directory> -b

###其他选项 -l LOG_LOCATION, --log LOG_LOCATION更改日志目录位置。默认为<output_directory>的父目录。

-m,--merge输入目录应包含成对的fastq(或gzip fastq)文件。配对文件将与pandaseq合并,然后再与abstar进行处理。注意,当使用basespace选项(-b,--basespace)时,此选项是隐含的。

-b,--basespace从基础空间(illumina的云存储环境)下载排序运行。由于illumina序列器产生成对的末端读取,因此暗示--merge

-u N, --uaid N序列包含长度为n的唯一抗体id(uaid,或分子条形码)。uaid将从每个输入序列的开头解析并添加到json输出中。负值会导致从序列末尾解析uaid。

-s SPECIES, --species SPECIES选择从中派生输入序列的种类。支持的选项有“human”、“mouse”和“macake”。默认为“人”。

-c,--cluster在芹菜集群上以分布式模式运行abstar。

-h,--help打印所有运行时选项的详细信息。

-D--debug更详细的日志记录。

###原料药 大多数核心的abstar函数都可以通过一个公共api获得,这使得作为集成分析管道的一个组件运行abstar变得更加容易。有关api的更多详细信息,请参阅abstar[文档](http://abstar.readthedocs.org)。

###帮助程序脚本 Abstar中包括一些帮助脚本: batch_mongoimport自动将多个json输出文件导入mongodb数据库。 build_abstar_germline_db从imgt-gapped-fasta的v、d和j基因片段文件创建abstar-germline数据库。 make_basespace_credfile为basespace生成一个凭据文件,如果使用abstar从basespace下载序列,则需要该文件。开发人员凭据是必需的,获取它们的过程[在这里](https://support.basespace.illumina.com/knowledgebase/articles/403618-python-run-downloader

###测试 要运行测试套件,请克隆或下载存储库并从顶级目录运行pytest ./

###要求 Python2.7,3.5+ 阿布蒂尔斯 生物疗法 芹菜 模拟(仅限Python2.7) nwalign3(用于python 2.7的nwalign) 皮蒙戈 比重瓶 scikit bio(对于python 2.7,<;=0.4.2)

以上所有依赖项都可以用pip安装,并在用pip安装abstar时自动安装。 如果您是python新手,一个很好的入门方法是安装[anaconda python发行版](https://www.continuum.io/downloads),其中包括pip以及大量有用的科学python包。

序列合并需要[pandaseq](https://github.com/neufeld/pandaseq) 批处理MongoImport需要[MongoDB](http://www.mongodb.org/) 下载basespace需要[basespace python sdk](https://github.com/basespace/basespace-python-sdk

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
当设备处于横向模式时,java显示软键盘   Java中数组和泛型的类型规则   javajavax。邮政运输send0()没有抛出异常这是有希望的   为Java项目记录一个日志文件   java JPA@OneToOne在映射到具有子类的抽象@实体时抛出错误   使用引用相等的java集合   java如何处理webview应用程序的应用程序链接   java无法执行dex:超出GC开销限制>库   使用rest-assured junit测试用例拒绝java连接   阵列我需要帮助Nbody分子模拟性能!!(java小程序)   java有时不能代替velocity   java中映射的字符串时间复杂性   打开STS后java JVM崩溃   java compareTo基于对象的两个值   Java HashMap自定义对象   无JSON方案响应的java放心JSON验证   java如何向json添加设置。selenium的exe文件   java为什么Element::GetElementsByTagnames失败?   java总结和改进ArrayAdapter,使用FOR循环