BarSeq数据分析。

barseq的Python项目详细描述


Build StatusPython 3.7

barseq

用于分析barseq数据的python包。

安装

pip install git+https://github.com/mjmlab/barseq.git@master

使用量

barseq -i <directory of sequencing reads> -b <barcode file> -e <experiment name>

-i/--input

  • 带illumina的目录在fastq或fastq.gz中读取。

-b/--barcodes

  • 带有条形码和对应基因名的csv文件。

-e/--experiment

  • 实验名称,用于创建结果文件夹。

所需文件

^ illumina的{str 1}$目录读取[-i]进行分析。可以是fastq或fastq.gz格式

@M06026:87:000000000-D69HY:1:1102:15909:1336 1:N:0:TGACCA
CTCTAGAAAGTATAGGAACTTCAGGGCCATTTATATACCTTCCACTCTTCAACCGTGTCTTGACTTGACCTGGATGTCTCTACTGCTGTCATGCTACGTAGCTCATGCTACGTCGATCTAGTCGATGCATGCTAGCTGATCGACTCTCTTC
+
A#>>>3AA2DD>FBFGBFBFBFDDFGGAAEEEHDHFFFDDDBDGDFDDDDDADFGFFDDBFFEBFD5DFEEBBADABFGFGBBFGDD5BF3F43B3F1/11B144BGEBF@BBFB0B0BBFBBBBBBBB?E/FGFBB?/???B???/?FGG

带基因名的条形码文件[-b]。需要采用CSV格式。

Barcode,Gene
ATGAAGACTGTTGCCGTA,WT
CACGACGCCCTCCGCGGA,gene1
ACTATTACGCAAAATAAT,gene2
ATGGAAGATATTATTATT,gene3
CCTCTCCAACCGGGTCTG,gene4
CCCGGTCGCCTAGCCCCG,gene5
GGCCCCCCGCCCGTCCCC,gene6
GGATCACTGCTAGCGTAT,gene7
CCTGCAGCAGCGGCCCGC,gene8
ACACATGCAGACATAGAG,gene9
CGCGCCATCCGCCGCCCA,gene10
AATATTCAGATGGGACGT,gene11

输出

results/目录

  • <;experiment>;_results.csv:在每个序列文件中找到的条形码计数。
GeneBarcodeSample 1Sample 2Sample 3...
gene1^{}50057...
gene2^{}121319...
gene3^{}131110...
_other_other284029...

barseq工作流

barseq_diagram

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
与JDBC(h2数据库)相比,使用hibernate的java长SQL查询   java高亮显示JComboBox中的文本,然后在用户输入内容时将其删除   java ifstream从字符串中读取字符时出错   java如何使用icu4j字符集实现和字符集解码?   javax:将json数组映射到对象列表   java无法执行目标组织。科德豪斯。mojo:execmavenplugin:1.2.1:exec(defaultcli)   java单击活动中的一个按钮将同时打开两个活动   java我想使用Jsoup从整个在线词典中获取定义,我必须做些什么来防止我的IP被阻塞?   如何防止Java图形中的闪烁?   将字符串转换为浮点的数组会创建意外的返回。JAVA   java JAVAFX:在BorderPane中的窗格之间切换   JavaSpringWebFlux网络客户端:延迟执行   java根据其他菜单中的选项显示子菜单?   ProcessBuilder的java设置工作目录不工作   java lucene:使StandardTokenizer适应Twitter数据