没有项目描述
cmsip的Python项目详细描述
CMSIP
从CMS-IP测序数据中检测不同的5HMC区域。
源URL:https://github.com/lijinbio/cmsip
安装
依赖性
- bsmap
bsmap
是moabs包中的一个组件。更多信息请参见moabs(https://github.com/sunnyisgalaxy/moabs)。
samtools:http://samtools.sourceforge.net
示例配置文件和说明
sampleinfo:
- sampleid: TKO2PE1b2
group: tko
filenames:
- TKO2PE1b2_R1.fastq.gz
- sampleid: TKO2PE2m
group: tko
filenames:
- TKO2PE2b1_R1.fastq.gz
- TKO2PE2b1_R2.fastq.gz
- sampleid: WTPE1b2
group: wt
filenames:
- WTPE1b2_R1.fastq.gz
- sampleid: WTPE2b2
group: wt
filenames:
- WTPE2b2_R1.fastq.gz
groupinfo:
group1: tko
group2: wt
datainfo:
reference: hg38.fa.gz
spikein: mm10.fa.gz
windowfile: hg38_w100.bed
windowsize: 100
fastqdir: test_data
outdir: outdir
statfile: outdir/qcstats.txt
cnttablefile: outdir/meancovtable.txt.gz
ttestfile: outdir/t.test.txt
numthreads: 20
verbose: True
sampleinfo
此块存储示例的详细元数据信息。
groupinfo
此块列出感兴趣的比较。另一种假设是group1
和group2
的平均值的真正差异小于0。
datainfo
- 参考
参考基因组的fasta文件,如hg38.fa.gz。
- 峰值
基因组峰值的fasta文件,如mm10.fa.gz。
- 窗口文件:hg38_w100.bed
橱窗里的基因组。这个窗口bin文件可以使用bedtools生成。例如
bedtools makewindows -g <(fetchChromSizes hg38) -w 100 > hg38_w100.bed
- 窗口大小:100
用于创建箱子的窗口大小。
- fastqdir:测试数据
包含原始fastq文件的根目录。
- outdir
临时和最终结果文件的根输出目录。
- statfile
质量控制统计文件。默认值为outdir/qcstats.txt。如果存在该文件,将跳过QC步骤,并且将针对现有的QC统计文件解析大小因子。否则,qc步骤将运行以生成统计文件。
- cnttablefile
区域计数表文件。默认值为outdir/meancovtable.txt.gz。如果存在该文件,将跳过计数步骤,并且将使用现有的计数表文件进行下游统计测试。否则,将执行计数步骤以生成计数表文件。
- t文件
统计测试结果文件。默认值为outdir/t.test.txt。如果存在此文件,则将不再运行任何任务。否则,统计测试将使用t-test在计数表上运行。