模体守恒分析工具
moca的Python项目详细描述
motif守恒分析工具moca
许可证
ISC
安装
要求
- pybedtools
- 生物圈
- 熊猫
- scipy
- 统计模型
- 侏儒
- 肖伯恩
- 模因=4.10.2
注:moca还依赖于meme4.11.0 因此,如果您使用4.10.2请确保fasta shuffle letters是更新的。
有关示例脚本,请参见travis/install meme.sh
使用pip
$ pip install moca
用于开发
$ git clone https://github.com:saketkc/moca.git
$ cd moca
$ conda env create -f environment.yml python=2.7
$ source activate mocadev
$ python setup.py install
工作流程
MOCA利用Phylop/PhastCons/GERP评分来评估 motif,假设是一个“真正的motif”会比 到它的周围(侧翼序列)。
使用量
$ moca Usage: moca [OPTIONS] COMMAND [ARGS]... moca: Motif Conservation Analysis Options: --version Show the version and exit. --help Show this message and exit. Commands: find_motifs Run meme to locate motifs and create... plot Create stacked conservation plots
模因分析
moca可以为您执行motif分析,给出一个包含 芯片序列峰值。
基因组构建和meme二进制位置通过配置文件指定。 提供了一个示例配置文件:tests/data/application.cfg,应该是 不言而喻。
莫卡发现主题
$ moca find_motifs -h Usage: moca find_motifs [OPTIONS] Run meme to locate motifs and create conservation stacked plots Options: -i, --bedfile TEXT Bed file input [required] -o, --oc TEXT Output Directory [required] -c, --configuration TEXT Configuration file [required] --slop-length INTEGER Flanking sequence length [required] --flank-motif INTEGER Length of sequence flanking motif [required] --n-motif INTEGER Number of motifs -t, --cores INTEGER Number of parallel MEME jobs [required] -g, -gb, --genome-build TEXT Key denoting genome build to use in configuration file [required] --show-progress Print progress -h, --help Show this message and exit.
MOCA图
$ moca plot -h
Usage: moca plot [OPTIONS]
Create stacked conservation plots
Options:
--meme-dir, --meme_dir TEXT MEME output directory [required]
--centrimo-dir, --centrimo_dir TEXT
Centrimo output directory [required]
--fimo-dir-sample, --fimo_dir_sample TEXT
Sample fimo.txt [required]
--fimo-dir-control, --fimo_dir_control TEXT
Control fimo.txt [required]
--name TEXT Plot title
--flank-motif INTEGER Length of sequence flanking motif
[required]
--motif INTEGER Motif number
-o, --oc TEXT Output Directory [required]
-c, --configuration TEXT Configuration file [required]
--show-progress Print progress
-g, -gb, --genome-build TEXT Key denoting genome build to use in
configuration file [required]
-h, --help Show this message and exit.
示例
大多数用户只需要使用命令行版本:
$ moca find_motifs -i encode_test_data/ENCFF002DAR.bed\ -c tests/data/application.cfg -g hg19 --show-progress
如果已经运行meme和centrimo,则创建绘图:
$ moca plot -c tests/data/application.cfg -g hg19\ --meme-dir moca_output/meme_out\ --centrimo-dir moca_output/centrimo_out\ --fimo-dir-sample moca_output/meme_out/fimo_out_1\ --fimo-dir-control moca_output/meme_out/fimo_random_1\ --name ENCODEID
还有一个结构化的API, 然而,它可能在某些地方缺少示例和文档。
学分
这个包是用Cookiecutter和audreyr/cookiecutter-pypackage项目模板创建的。
历史记录
0.4.1(2017-02-16)
- 添加了$delta$选项,用于示例和控件测试
- 删除了未使用的要求:IP地址
- 修正了要绘图的meme runner
0.3.3(2016-10-03)
- 删除了pycairo依赖项
0.2.9(2016-05-31)
- 不要在meme失败时默默地失败
- 支持–支持并行线程的核心
0.2.8(2016-05-30)
- 修复了mocacli中缺少meme管道的问题
0.2.7(2016-05-30)
- 修复了mocacli中未处理丢失假发密钥的错误
0.2.4(2016-05-29)
- 已清除脚本目录下未使用的脚本
- 添加配置文件示例
0.2.3(2016-05-29)
- 在setup.py中包含package目录
- 在清单中包含requirements.txt
0.2.0(2016-05-29)
- pypi上的第一个版本。