这个python模块生成、检查和更正四进制hamming条码。
hamstring的Python项目详细描述
[![构建状态](https://travis-ci.org/mdshw5/hamstring.svg?branch=master)(https://travis ci.org/mdshw5/hamstring)
[![pypi](https://pypi.python.org/pypi/hamstring)](https://img.shields.io/pypi/v/hamstring.svg?branch=master)
此python模块生成、检查并更正四元hamming条码。产生四元(DNA)汉明条码的理论来自出版物[Bystrykh,L.V.(2012)。基于hamming码的广义dna条码设计。《公共科学图书馆一号》(http://www.plos one.org/article/info:doi/10.1371/journal.pone.0036852)。目前,"仓位"模块只适用于汉明7,4编码,但可以推广到其他大小的数据和奇偶校验位。
[![图1 bystrykh等人](redist/figure1.png)](http://journals.plos.org/plosone/article?id=10.1371/journal.pone.0036852\pone-0036852-g001)
--奇偶校验
奇偶校验位的长度,例如汉明8的4,4.
默认值=3
示例输出:
索引基4核苷酸gc
0 0000000 aaaaaaaaaa 0.0
1 330301 ttaaac 0.14
2 2202002 ggagag 0.57
3 1101003 ccacat 0.43
4 0303010 ataca 0.14
**汉明校验和列表DNA条形码**
check barcodes.py[-h]list
参数:
要检查的条形码列表,每行一个
-h,--帮助显示此帮助消息并退出
-p奇偶校验,--奇偶校验
奇偶校验位的长度,例如汉明8,4的4。
默认值=3
示例输出:
t在3号位置
agagagagagaga正常
tcacagc正常
gaacagg gaaaagg a>;c在位置4
ctatagt ctatagt ok
tttaaan nnnnnnn bad
nnnnnnn nnnnn bad
**tag fastq用条形码读取(用于生成模拟数据集)**
参数:
nb生成
fastq fastq文件以处理
新fastq文件的输出名称
-e,--rate单个条形码基本错误的错误率。默认值=0.05
-p奇偶校验,-parity奇偶校验
奇偶校验位的长度,例如4表示hamming8,4。
default=3
-h,--帮助显示此帮助消息并退出
hhhdh>;dgg@7@?##########################################
example output:
@HWI-EAS179_0001:5:1:7:119#0/1
CCATGGCCAGGGCGCGAATGNTTTGAGAGGGANATTGGAAANNNNNGATAGANNGGNCTATNNTGNNNNNNNNNNNNNNNNNN
+
HHHHHHHHIHHHGHHHFDHH#EHHH?hhhdh>;dgg@7@?##########################################
**Check and fix barcodes in fastq file**
fixFastq.py [-h] [-s] list fastq out
arguments:
list list of barcodes used in experiment, one per line
fastq fastq file to process
out 新fastq文件名
-s,--strict将列表中未列出的所有条形码更改为'n'
-h,--帮助显示此帮助消息并退出
hhhdh>;dgg@7@?##########################################
example output:
@HWI-EAS179_0001:5:1:7:119#0/1
CCATGGCCAGGGCGCGAATGNTTTGAGAGGGANATTGGAAannnnngataganggnctatnntgnnnnnnnnnnnnnnnnnnnn
+
hhhhhhhhhhhhhhfdhh?hhhdh>;dgg@7@?##########################################
## Requirements
- Python 2.7 or Python 3.2+
## Hamstring Module
The core hamstring module has no external module dependencies and should run under any OS.
`base4Encode(n,d)`用于将十进制表示法*n*转换为带*d*前导数字的四进制表示法。*示例*:
drastring.base4encode(22,4)
[0,1,1,2]
`generate hamming(data,parity)`用于从具有*parity*奇偶位数的四位数字*data*列表中生成dna四位hamming码。
*示例*:
``python
>;生成编码([0,1,1,2,3)
条形码(base4='1100112',核苷酸='ccaaccg',gc=0.71)
>;>generatehamming([0,1,1,2],4)
条形码(base4='11001122',核苷酸='ccaaccgg',gc=0.75)
`````
`解码汉明码(条形码,奇偶校验)`用于解码*条形码*核苷酸汉明码带*奇偶校验*奇偶校验位数的字符串,并根据需要执行错误更正。
*示例*:
`` python
>;>decodehamming('ccaaccg',3)
checkedbarcode(nucleode='ccaaccg',chksum='ok')
>; 检查条码(核苷酸='ccaaccgg',chksum='ok')
>;>decodehamming('ccatcg',3)
检查条码(核苷酸='ccaaccg',chksum='a>;t at pos 4')
>; 检查条码(核苷酸='ccaaccgg',chksum='a>;T在位置4’)
>;>decodehamming('tcatccgg',4)
checkedbarcode(核苷酸='nnnnnnn',chksum='bad')
````
[![pypi](https://pypi.python.org/pypi/hamstring)](https://img.shields.io/pypi/v/hamstring.svg?branch=master)
此python模块生成、检查并更正四元hamming条码。产生四元(DNA)汉明条码的理论来自出版物[Bystrykh,L.V.(2012)。基于hamming码的广义dna条码设计。《公共科学图书馆一号》(http://www.plos one.org/article/info:doi/10.1371/journal.pone.0036852)。目前,"仓位"模块只适用于汉明7,4编码,但可以推广到其他大小的数据和奇偶校验位。
[![图1 bystrykh等人](redist/figure1.png)](http://journals.plos.org/plosone/article?id=10.1371/journal.pone.0036852\pone-0036852-g001)
--奇偶校验
奇偶校验位的长度,例如汉明8的4,4.
默认值=3
示例输出:
索引基4核苷酸gc
0 0000000 aaaaaaaaaa 0.0
1 330301 ttaaac 0.14
2 2202002 ggagag 0.57
3 1101003 ccacat 0.43
4 0303010 ataca 0.14
**汉明校验和列表DNA条形码**
check barcodes.py[-h]list
参数:
要检查的条形码列表,每行一个
-h,--帮助显示此帮助消息并退出
-p奇偶校验,--奇偶校验
奇偶校验位的长度,例如汉明8,4的4。
默认值=3
示例输出:
t在3号位置
agagagagagaga正常
tcacagc正常
gaacagg gaaaagg a>;c在位置4
ctatagt ctatagt ok
tttaaan nnnnnnn bad
nnnnnnn nnnnn bad
**tag fastq用条形码读取(用于生成模拟数据集)**
参数:
nb生成
fastq fastq文件以处理
新fastq文件的输出名称
-e,--rate单个条形码基本错误的错误率。默认值=0.05
-p奇偶校验,-parity奇偶校验
奇偶校验位的长度,例如4表示hamming8,4。
default=3
-h,--帮助显示此帮助消息并退出
hhhdh>;dgg@7@?##########################################
example output:
@HWI-EAS179_0001:5:1:7:119#0/1
CCATGGCCAGGGCGCGAATGNTTTGAGAGGGANATTGGAAANNNNNGATAGANNGGNCTATNNTGNNNNNNNNNNNNNNNNNN
+
HHHHHHHHIHHHGHHHFDHH#EHHH?hhhdh>;dgg@7@?##########################################
**Check and fix barcodes in fastq file**
fixFastq.py [-h] [-s] list fastq out
arguments:
list list of barcodes used in experiment, one per line
fastq fastq file to process
out 新fastq文件名
-s,--strict将列表中未列出的所有条形码更改为'n'
-h,--帮助显示此帮助消息并退出
hhhdh>;dgg@7@?##########################################
example output:
@HWI-EAS179_0001:5:1:7:119#0/1
CCATGGCCAGGGCGCGAATGNTTTGAGAGGGANATTGGAAannnnngataganggnctatnntgnnnnnnnnnnnnnnnnnnnn
+
hhhhhhhhhhhhhhfdhh?hhhdh>;dgg@7@?##########################################
## Requirements
- Python 2.7 or Python 3.2+
## Hamstring Module
The core hamstring module has no external module dependencies and should run under any OS.
`base4Encode(n,d)`用于将十进制表示法*n*转换为带*d*前导数字的四进制表示法。*示例*:
drastring.base4encode(22,4)
[0,1,1,2]
`generate hamming(data,parity)`用于从具有*parity*奇偶位数的四位数字*data*列表中生成dna四位hamming码。
*示例*:
``python
>;生成编码([0,1,1,2,3)
条形码(base4='1100112',核苷酸='ccaaccg',gc=0.71)
>;>generatehamming([0,1,1,2],4)
条形码(base4='11001122',核苷酸='ccaaccgg',gc=0.75)
`````
`解码汉明码(条形码,奇偶校验)`用于解码*条形码*核苷酸汉明码带*奇偶校验*奇偶校验位数的字符串,并根据需要执行错误更正。
*示例*:
`` python
>;>decodehamming('ccaaccg',3)
checkedbarcode(nucleode='ccaaccg',chksum='ok')
>;
>;>decodehamming('ccatcg',3)
检查条码(核苷酸='ccaaccg',chksum='a>;t at pos 4')
>;
>;>decodehamming('tcatccgg',4)
checkedbarcode(核苷酸='nnnnnnn',chksum='bad')
````