这个python模块生成、检查和更正四进制hamming条码。

hamstring的Python项目详细描述


[![构建状态](https://travis-ci.org/mdshw5/hamstring.svg?branch=master)(https://travis ci.org/mdshw5/hamstring)
[![pypi](https://pypi.python.org/pypi/hamstring)](https://img.shields.io/pypi/v/hamstring.svg?branch=master)


此python模块生成、检查并更正四元hamming条码。产生四元(DNA)汉明条码的理论来自出版物[Bystrykh,L.V.(2012)。基于hamming码的广义dna条码设计。《公共科学图书馆一号》(http://www.plos one.org/article/info:doi/10.1371/journal.pone.0036852)。目前,"仓位"模块只适用于汉明7,4编码,但可以推广到其他大小的数据和奇偶校验位。

[![图1 bystrykh等人](redist/figure1.png)](http://journals.plos.org/plosone/article?id=10.1371/journal.pone.0036852\pone-0036852-g001)


--奇偶校验
奇偶校验位的长度,例如汉明8的4,4.
默认值=3

示例输出:


索引基4核苷酸gc
0 0000000 aaaaaaaaaa 0.0
1 330301 ttaaac 0.14
2 2202002 ggagag 0.57
3 1101003 ccacat 0.43
4 0303010 ataca 0.14

**汉明校验和列表DNA条形码**

check barcodes.py[-h]list


参数:
要检查的条形码列表,每行一个
-h,--帮助显示此帮助消息并退出
-p奇偶校验,--奇偶校验
奇偶校验位的长度,例如汉明8,4的4。
默认值=3


示例输出:

t在3号位置
agagagagagaga正常
tcacagc正常
gaacagg gaaaagg a>;c在位置4
ctatagt ctatagt ok
tttaaan nnnnnnn bad
nnnnnnn nnnnn bad

**tag fastq用条形码读取(用于生成模拟数据集)**


参数:
nb生成
fastq fastq文件以处理
新fastq文件的输出名称
-e,--rate单个条形码基本错误的错误率。默认值=0.05
-p奇偶校验,-parity奇偶校验
奇偶校验位的长度,例如4表示hamming8,4。
default=3
-h,--帮助显示此帮助消息并退出

hhhdh>;dgg@7@?##########################################

example output:

@HWI-EAS179_0001:5:1:7:119#0/1
CCATGGCCAGGGCGCGAATGNTTTGAGAGGGANATTGGAAANNNNNGATAGANNGGNCTATNNTGNNNNNNNNNNNNNNNNNN
+
HHHHHHHHIHHHGHHHFDHH#EHHH?hhhdh>;dgg@7@?##########################################

**Check and fix barcodes in fastq file**

fixFastq.py [-h] [-s] list fastq out

arguments:
list list of barcodes used in experiment, one per line
fastq fastq file to process
out 新fastq文件名
-s,--strict将列表中未列出的所有条形码更改为'n'
-h,--帮助显示此帮助消息并退出

hhhdh>;dgg@7@?##########################################

example output:

@HWI-EAS179_0001:5:1:7:119#0/1
CCATGGCCAGGGCGCGAATGNTTTGAGAGGGANATTGGAAannnnngataganggnctatnntgnnnnnnnnnnnnnnnnnnnn
+
hhhhhhhhhhhhhhfdhh?hhhdh>;dgg@7@?##########################################

## Requirements

- Python 2.7 or Python 3.2+

## Hamstring Module

The core hamstring module has no external module dependencies and should run under any OS.

`base4Encode(n,d)`用于将十进制表示法*n*转换为带*d*前导数字的四进制表示法。*示例*:

drastring.base4encode(22,4)
[0,1,1,2]


`generate hamming(data,parity)`用于从具有*parity*奇偶位数的四位数字*data*列表中生成dna四位hamming码。
*示例*:

``python
>;生成编码([0,1,1,2,3)
条形码(base4='1100112',核苷酸='ccaaccg',gc=0.71)

>;>generatehamming([0,1,1,2],4)
条形码(base4='11001122',核苷酸='ccaaccgg',gc=0.75)
`````

`解码汉明码(条形码,奇偶校验)`用于解码*条形码*核苷酸汉明码带*奇偶校验*奇偶校验位数的字符串,并根据需要执行错误更正。
*示例*:

`` python
>;>decodehamming('ccaaccg',3)
checkedbarcode(nucleode='ccaaccg',chksum='ok')

>;检查条码(核苷酸='ccaaccgg',chksum='ok')

>;>decodehamming('ccatcg',3)
检查条码(核苷酸='ccaaccg',chksum='a>;t at pos 4')

>;检查条码(核苷酸='ccaaccgg',chksum='a>;T在位置4’)

>;>decodehamming('tcatccgg',4)
checkedbarcode(核苷酸='nnnnnnn',chksum='bad')
````

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java StoredProcedureCall 1x Varchar输出1x游标输出   java StackOverflower运行时错误   算法Java基准测试:确保对象在超出范围后不被重用   java在SpringDataNeo4j中使用RelationshipEntity保存节点的正确方法是什么?   命令行参数设置登录java的属性   Java泛型AnyType,如何允许调用任何方法?   java如何检查Html字符串和字符串   sql如何插入一个日期,然后从java执行的存储过程中向oracle数据库中插入的日期添加小时、分钟和秒   java 安卓 3布局相同的活动   安卓应用程序中的java毕达哥拉斯   使用javaw在批处理文件中运行JAR的服务会在process explorer XYNTService中产生多个java进程   java需要在Derby中编写正确的查询   多线程Java在缓存中为多个线程保存变量   持久化java实体引用问题   java在SpringMVC应用程序中使用本地线程安全吗?   JavaSwing,100个文本字段都有类似的任务,所以我想写一个函数来完成这个任务   java我们在新字符串(“literal”)中放置的字符串文字发生了什么变化;   java注入需要在GUI中使用枚举的对象   在Spark SQL中加载JDBC表时java数据不正确