高思维量测序数据的综合分析
metaseq的Python项目详细描述
简言之,这篇文章的目的是把许多现有的软件捆绑在一起。
探索基因组数据的框架。它侧重于灵活性和
不同基因组数据集的交互探索和绘图。
metaseq的主要文档可以在https://daler.github.io/metaseq找到。
如果您在工作中使用metaseq,请引用以下出版物:
Dale, R. K., Matzat, L. H. & Lei, E. P. metaseq: a Python package for integrative genome-wide analysis reveals relationships between chromatin insulators and associated nuclear mRNA. Nucleic Acids Res. 42, 9158–9170 (2014). http://www.ncbi.nlm.nih.gov/pubmed/25063299
示例1:启动程序上的平均芯片序列信号
Example 1陪你走 通过创建以下热图和线图:
上图:ATF3芯片序列信号在转录起始位点(TSS)上的热图 人k562细胞中的chr17。中:所有TSS的平均芯片富集度 +/-1KB,95%置信区间。底部:与ATF3基因敲除RNA序列整合 结果显示,与上升的转录本相比,差异富集, 或者在3级击落时没有改变。
示例2:差分表达式散点图
Example 2步行 通过创建下面的散点图和边缘直方图 图:
ATF3基因敲除的对照与敲除表达(log2(fpkm+1))。 实验。每个点代表17号染色体上的一个转录本。 边缘分布显示在顶部和侧面。1:1线显示为 虚线由简单的2倍决定的上调和下调基因 切断。
其他功能
此外,metaseq还提供:
- 用于访问“基因组信号”的不确定格式的api,允许您 bam、bed、vcf、gtf、gff、bigbed和bigwig使用相同的api。
- 从上述文件格式进行并行数据访问
- “迷你浏览器”,可缩放和可平移的python图形,显示基因组 信号和基因模型,通过点击感兴趣的特征生成
- pandas.dataframes的包装器,用于简化操作和绘图 包含基因信息的表格结果数据(如deseq结果 桌子)
- 将由基因组间隔(想想bam或bed文件)键入的数据与数据集成 按基因ID键控(如袖扣或deseq结果表)
查看full documentation的 更多。