BarSeq数据分析。
barseq的Python项目详细描述
barseq
用于分析barseq数据的python包。
安装
pip install git+https://github.com/mjmlab/barseq.git@master
使用量
barseq -i <directory of sequencing reads> -b <barcode file> -e <experiment name>
-i
/--input
- 带illumina的目录在fastq或fastq.gz中读取。
-b
/--barcodes
- 带有条形码和对应基因名的csv文件。
-e
/--experiment
- 实验名称,用于创建结果文件夹。
所需文件
^ illumina的{str 1}$目录读取[-i
]进行分析。可以是fastq或fastq.gz格式
@M06026:87:000000000-D69HY:1:1102:15909:1336 1:N:0:TGACCA CTCTAGAAAGTATAGGAACTTCAGGGCCATTTATATACCTTCCACTCTTCAACCGTGTCTTGACTTGACCTGGATGTCTCTACTGCTGTCATGCTACGTAGCTCATGCTACGTCGATCTAGTCGATGCATGCTAGCTGATCGACTCTCTTC + A#>>>3AA2DD>FBFGBFBFBFDDFGGAAEEEHDHFFFDDDBDGDFDDDDDADFGFFDDBFFEBFD5DFEEBBADABFGFGBBFGDD5BF3F43B3F1/11B144BGEBF@BBFB0B0BBFBBBBBBBB?E/FGFBB?/???B???/?FGG
带基因名的条形码文件[-b
]。需要采用CSV格式。
Barcode,Gene ATGAAGACTGTTGCCGTA,WT CACGACGCCCTCCGCGGA,gene1 ACTATTACGCAAAATAAT,gene2 ATGGAAGATATTATTATT,gene3 CCTCTCCAACCGGGTCTG,gene4 CCCGGTCGCCTAGCCCCG,gene5 GGCCCCCCGCCCGTCCCC,gene6 GGATCACTGCTAGCGTAT,gene7 CCTGCAGCAGCGGCCCGC,gene8 ACACATGCAGACATAGAG,gene9 CGCGCCATCCGCCGCCCA,gene10 AATATTCAGATGGGACGT,gene11
输出
results/
目录
- <;experiment>;_results.csv:在每个序列文件中找到的条形码计数。
Gene | Barcode | Sample 1 | Sample 2 | Sample 3 | ... |
---|---|---|---|---|---|
gene1 | ^{ | 500 | 5 | 7 | ... |
gene2 | ^{ | 12 | 13 | 19 | ... |
gene3 | ^{ | 13 | 11 | 10 | ... |
_other | _other | 28 | 40 | 29 | ... |