估计相对细胞周期的亚基因组学管道。

menace的Python项目详细描述


Menace
==


这套软件是从亚基因组数据中提取峰谷比的算法的基本实现,如`(Korem等人,Science,
2015)和lt;http://science.sciencemag.org/content/349/6252/1101>;`` uuu.

位置:
----

~~


确保"pip"是您的*python2*安装的pypi命令,
然后:

……代码::bash

pip安装威胁

^^^

…代码::bash

git clone git@github.com:zertan/meanee.git
cd meanee
python setup.py install

其他
依赖项必须手动安装(如果您对
有疑问,我建议您咨询您的群集IT帮助台)。


元素(因此slurm是当前支持的唯一排队系统)。


依赖项:
~~~~~~~~~~~~~~~~



numpy
scipy
biopython
matplotlib
xmltodict
configparser
lmfit
newick
Jinja2
Doric
-e git+https://github.com/pathoscope/pathoscope.git egg=pathoscope

`samtools<;http://www.htslib.org/download/>;`net/projects/bowtie bio/files/bowtie2/2.2.9/>;` `

`pathoscope
2.0<;https://sourceforge.net/projects/pathoscope/files/?source=navbar>;`
(应通过上述pip命令安装,但请确保shell中可访问"pathoscope
id",即位于系统路径上)

`parallel<;http://www.gnu.org/software/parallel/>;`

`doric<;http://tubic.tju.edu.cn/doric/download.php>;`是一个
染色体起源位置(orics)的数据库,它是(推荐的)管道的可选
依赖项。请访问链接并输入要下载的电子邮件。


usage
----


通过运行"meance init"初始化当前目录中的项目。
标识一组NCBI基因组参考登录号并将其放入"../searchstrings"(或使用默认值,其中包括对人类肠道常见细菌的
*最小*引用集)。

2。确定感兴趣的元基因组群组(手动下载或添加
url,如下所述)并添加到数据文件夹。支持的输入:
raw/gzipped/bzipped".fastq"文件。

3。在"project.conf"文件中添加信息。

4。编辑"loadmodules.sh"以包含
集群的**python2**模块(如果
默认值可以访问python2,则注释掉这些行)。

5.运行"威胁已满"(如果在群集登录节点上,请使用"nohup{cmd}&;在注销后保持活动状态)。等待作业完成。在project
目录中运行"meane collect"。

notes
^^^^


meane脚本是管道所有部分的通用工具,包括下载引用和亚基因组数据、构建引用索引、设置必要的文件结构和提交ng
变成泥浆。因此,所有配置都要在
project.conf中设置(请参见"bin/project.conf.example"中的示例)。

一个更全面的参考库将产生更高的覆盖率和更精确的值。在"extra/referenceacclong.txt"中可以找到一个更全面的人类肠道细菌列表。ure(*example*)
----------


使用上述用法示例,路径结构将如下所示。






$data路径
"sample01"(例如err525688)
。{sample01_1.fastq.gz}
。{sample01_2.fastq.gz}成对的亚基因组读取
.


$ref_path
index
{ref_name.*.bt2l}bowtie2索引文件
fasta
{加入.fasta}

{accesession.xml}包含额外基因组引用信息的xml文件
taxids.txt


$doric廑path
bacteria廑record.dat
bacteria廑seq.fas

$output廑path
"sample01"
。深度
。|{accessing.depth}每个引用的覆盖率文件
。log
{accessing.log}从piecewisefit
npy
{accessing_oric_terc.npy}numpy文件输出日志,其中包含起始/终止位置和相对c周期
_png
{accessing_fit.png}平滑覆盖范围的分段拟合图像
accessing-sam-report.tsv pathoscope2重新分配报告

将批处理作业发送到slurm以便在计算集群上进行并行处理的脚本。

**输入:**none

**输出:**在"project.conf"


main build.sh
^^^^^^^^^^^^^^^^^


集群上。

**输入:**无

**输出:**计算节点上的临时路径和文件

^^^^^^^^^^^^^^^


/>来自多个样本的原点位置,以便更好地估计)。

**input:*$output\'u path,$doric\'u path,$ref\'u path,bin/accloc.csv

**output:**furny.csv,ptr.csv,doublingtime.csv,header.csv

pieclewisefit.py
^^^^^^^^^^^^^^^^^^^^^^^

t和先前对生成的
深度文件进行检查,以筛选出生成足够数据以生成可靠覆盖信号以估计
复制源的那些实例。一旦使用完整队列对这些变量进行了估计,就可以进一步使用这些数据为每个样本生成ptr变量。


**输入:*{reference.depth}

**输出:*{reference\{oric.npy},{reference\{reference.npy},
{reference\{coverage.png},{reference\{fit.log}

fetchseq.py
^^^^^^^^^^


此实用程序可用于从
ncbi服务器下载".fasta"引用文件。

**输入:**searchstrings.txt,

**输出:*{reference.fasta},{reference.xml},taxids.txt

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java文件分块,获取长度字节   java嵌入式Tomcat不执行jsf页面   java我的数据库中有2个实体,但hibernate返回其中6个。   java如何基于逗号拆分字符串   java取消已经运行的CompletableFutures的预期模式是什么   java如何在informix中从另一个数据库复制表ddl和数据   为什么图片是黑色的?   java根据字符串数组中的单词筛选列表   Java8的集合。平行流有效吗?   Kotlin中的java静态内部类   java如何在GUI中生成一列字符串   javafx如何正确使用高对比度主题?   带空格的javascript Httpurlconnection参数   java如何设置GridBagLayout的约束   java如何在一个线程可能尚未初始化时关闭另一个线程   java将简单时间格式转换为特殊时间格式(hhmmt)   安卓/java阵列重复过滤器的问题   java在队列的链接实现下,入队和出队是如何工作的   java更新sql外键约束