Illumina甲基化阵列分析软件
methylize的Python项目详细描述
methylize
是一个python包,用于分析Illumina甲基化数组的输出。它补充了methylprep
和{
- Overview
- Demonstrating differentially methylated probe (DMP) detection (volcano plot) and mapping to chrosomes (manhattan plot)
- About BumpHunter
甲基化包装
methylize
包包含用于处理来自本地文件的数据的高级api和允许您在运行methylprep
和methylcheck
之后分析数据的低级功能。为了获得最大的可用性,将methylize
与处理过的示例数据(beta值或m值的数据框和包含有关示例的元数据的单独数据框)一起导入Jupyer笔记本。在
Methylize
允许您对所有探针进行线性或逻辑回归,并确定DNA发生差异修饰的甲基组中的兴趣点。然后,您可以使用这些回归结果来创建volcano plots和{em1}$manhattan plots。在
曼哈顿地块示例
火山图样本
可定制:打印尺寸、调色板和截止p值线可由用户设置。 导出:可以导出所有探测统计信息,也可以只将重要探测导出为CSV或python pickled DataFrame。在
安装
pipinstallmethylize
差异甲基化位置/探针(DMP)检测
diff_meth_pos()
函数搜索单个差异甲基化位置/探针
(DMPs)通过回归给定条件下每个样品的甲基化M值
根据基因组定位数据。在
表型可以作为
- 基于字符串的列表
- 整数二进制数据
- 数字连续数据
- (TODO:使用methyprep生成的元数据数据帧作为输入)
当运行logistic回归时,该函数将表型的字符串标签合并为0s和1s。 logistic回归只允许2个表型。线性回归可以有两个以上的表型。在
输入和参数
^{pr2}$
返回
A pandas dataframe of regression statistics with a row for each probe analyzed
and columns listing the individual probe's regression statistics of:
- regression coefficient
- lower limit of the coefficient's 95% confidence interval
- upper limit of the coefficient's 95% confidence interval
- standard error
- p-value (phenotype group A vs B - likelihood that the difference is significant for this probe/location)
- q-value (p-values corrected for multiple testing using the Benjamini-Hochberg FDR method)
- FDR_QValue: p value, adjusted for multiple comparisons
The rows are sorted by q-value in ascending order to list the most significant
probes first. If q_cutoff is specified, only probes with significant q-values
less than the cutoff will be returned in the dataframe.
如果进度条缺失: 如果在jupyterlab笔记本中看不到进度条,请尝试以下操作: -conda安装-c conda forge nodejs -jupyter labextension安装@jupyter widgets/jupyterlab管理器
- 项目
标签: