估计相对细胞周期的亚基因组学管道。
menace的Python项目详细描述
Menace
==
这套软件是从亚基因组数据中提取峰谷比的算法的基本实现,如`(Korem等人,Science,
2015)和lt;http://science.sciencemag.org/content/349/6252/1101>;`` uuu.
位置:
----
~~
确保"pip"是您的*python2*安装的pypi命令,
然后:
……代码::bash
pip安装威胁
^^^
…代码::bash
git clone git@github.com:zertan/meanee.git
cd meanee
python setup.py install
其他
依赖项必须手动安装(如果您对
有疑问,我建议您咨询您的群集IT帮助台)。
元素(因此slurm是当前支持的唯一排队系统)。
依赖项:
~~~~~~~~~~~~~~~~
:
numpy
scipy
biopython
matplotlib
xmltodict
configparser
lmfit
newick
Jinja2
Doric
-e git+https://github.com/pathoscope/pathoscope.git egg=pathoscope
`samtools<;http://www.htslib.org/download/>;`net/projects/bowtie bio/files/bowtie2/2.2.9/>;` `
`pathoscope
2.0<;https://sourceforge.net/projects/pathoscope/files/?source=navbar>;`
(应通过上述pip命令安装,但请确保shell中可访问"pathoscope
id",即位于系统路径上)
`parallel<;http://www.gnu.org/software/parallel/>;`
`doric<;http://tubic.tju.edu.cn/doric/download.php>;`是一个
染色体起源位置(orics)的数据库,它是(推荐的)管道的可选
依赖项。请访问链接并输入要下载的电子邮件。
usage
----
通过运行"meance init"初始化当前目录中的项目。
标识一组NCBI基因组参考登录号并将其放入"../searchstrings"(或使用默认值,其中包括对人类肠道常见细菌的
*最小*引用集)。
2。确定感兴趣的元基因组群组(手动下载或添加
url,如下所述)并添加到数据文件夹。支持的输入:
raw/gzipped/bzipped".fastq"文件。
3。在"project.conf"文件中添加信息。
4。编辑"loadmodules.sh"以包含
集群的**python2**模块(如果
默认值可以访问python2,则注释掉这些行)。
5.运行"威胁已满"(如果在群集登录节点上,请使用"nohup{cmd}&;在注销后保持活动状态)。等待作业完成。在project
目录中运行"meane collect"。
notes
^^^^
meane脚本是管道所有部分的通用工具,包括下载引用和亚基因组数据、构建引用索引、设置必要的文件结构和提交ng
变成泥浆。因此,所有配置都要在
project.conf中设置(请参见"bin/project.conf.example"中的示例)。
一个更全面的参考库将产生更高的覆盖率和更精确的值。在"extra/referenceacclong.txt"中可以找到一个更全面的人类肠道细菌列表。ure(*example*)
----------
使用上述用法示例,路径结构将如下所示。
:
$data路径
"sample01"(例如err525688)
。{sample01_1.fastq.gz}
。{sample01_2.fastq.gz}成对的亚基因组读取
.
$ref_path
index
{ref_name.*.bt2l}bowtie2索引文件
fasta
{加入.fasta}
头
{accesession.xml}包含额外基因组引用信息的xml文件
taxids.txt
$doric廑path
bacteria廑record.dat
bacteria廑seq.fas
$output廑path
"sample01"
。深度
。|{accessing.depth}每个引用的覆盖率文件
。log
{accessing.log}从piecewisefit
npy
{accessing_oric_terc.npy}numpy文件输出日志,其中包含起始/终止位置和相对c周期
_png
{accessing_fit.png}平滑覆盖范围的分段拟合图像
accessing-sam-report.tsv pathoscope2重新分配报告
将批处理作业发送到slurm以便在计算集群上进行并行处理的脚本。
**输入:**none
**输出:**在"project.conf"
main build.sh
^^^^^^^^^^^^^^^^^
在
集群上。
**输入:**无
**输出:**计算节点上的临时路径和文件
^^^^^^^^^^^^^^^
/>来自多个样本的原点位置,以便更好地估计)。
**input:*$output\'u path,$doric\'u path,$ref\'u path,bin/accloc.csv
**output:**furny.csv,ptr.csv,doublingtime.csv,header.csv
pieclewisefit.py
^^^^^^^^^^^^^^^^^^^^^^^
t和先前对生成的
深度文件进行检查,以筛选出生成足够数据以生成可靠覆盖信号以估计
复制源的那些实例。一旦使用完整队列对这些变量进行了估计,就可以进一步使用这些数据为每个样本生成ptr变量。
**输入:*{reference.depth}
**输出:*{reference\{oric.npy},{reference\{reference.npy},
{reference\{coverage.png},{reference\{fit.log}
fetchseq.py
^^^^^^^^^^
此实用程序可用于从
ncbi服务器下载".fasta"引用文件。
**输入:**searchstrings.txt,
**输出:*{reference.fasta},{reference.xml},taxids.txt
==
这套软件是从亚基因组数据中提取峰谷比的算法的基本实现,如`(Korem等人,Science,
2015)和lt;http://science.sciencemag.org/content/349/6252/1101>;`` uuu.
位置:
----
确保"pip"是您的*python2*安装的pypi命令,
然后:
……代码::bash
pip安装威胁
…代码::bash
git clone git@github.com:zertan/meanee.git
cd meanee
python setup.py install
其他
依赖项必须手动安装(如果您对
有疑问,我建议您咨询您的群集IT帮助台)。
元素(因此slurm是当前支持的唯一排队系统)。
依赖项:
~~~~~~~~~~~~~~~~
:
scipy
biopython
matplotlib
xmltodict
configparser
lmfit
newick
Jinja2
Doric
-e git+https://github.com/pathoscope/pathoscope.git egg=pathoscope
`samtools<;http://www.htslib.org/download/>;`net/projects/bowtie bio/files/bowtie2/2.2.9/>;` `
`pathoscope
2.0<;https://sourceforge.net/projects/pathoscope/files/?source=navbar>;`
(应通过上述pip命令安装,但请确保shell中可访问"pathoscope
id",即位于系统路径上)
`parallel<;http://www.gnu.org/software/parallel/>;`
`doric<;http://tubic.tju.edu.cn/doric/download.php>;`是一个
染色体起源位置(orics)的数据库,它是(推荐的)管道的可选
依赖项。请访问链接并输入要下载的电子邮件。
usage
----
通过运行"meance init"初始化当前目录中的项目。
标识一组NCBI基因组参考登录号并将其放入"../searchstrings"(或使用默认值,其中包括对人类肠道常见细菌的
*最小*引用集)。
2。确定感兴趣的元基因组群组(手动下载或添加
url,如下所述)并添加到数据文件夹。支持的输入:
raw/gzipped/bzipped".fastq"文件。
3。在"project.conf"文件中添加信息。
4。编辑"loadmodules.sh"以包含
集群的**python2**模块(如果
默认值可以访问python2,则注释掉这些行)。
5.运行"威胁已满"(如果在群集登录节点上,请使用"nohup{cmd}&;在注销后保持活动状态)。等待作业完成。在project
目录中运行"meane collect"。
notes
^^^^
meane脚本是管道所有部分的通用工具,包括下载引用和亚基因组数据、构建引用索引、设置必要的文件结构和提交ng
变成泥浆。因此,所有配置都要在
project.conf中设置(请参见"bin/project.conf.example"中的示例)。
一个更全面的参考库将产生更高的覆盖率和更精确的值。在"extra/referenceacclong.txt"中可以找到一个更全面的人类肠道细菌列表。ure(*example*)
----------
使用上述用法示例,路径结构将如下所示。
:
$data路径
"sample01"(例如err525688)
。{sample01_1.fastq.gz}
。{sample01_2.fastq.gz}成对的亚基因组读取
.
$ref_path
index
{ref_name.*.bt2l}bowtie2索引文件
fasta
{加入.fasta}
头
{accesession.xml}包含额外基因组引用信息的xml文件
taxids.txt
$doric廑path
bacteria廑record.dat
bacteria廑seq.fas
$output廑path
"sample01"
。深度
。|{accessing.depth}每个引用的覆盖率文件
。log
{accessing.log}从piecewisefit
npy
{accessing_oric_terc.npy}numpy文件输出日志,其中包含起始/终止位置和相对c周期
_png
{accessing_fit.png}平滑覆盖范围的分段拟合图像
accessing-sam-report.tsv pathoscope2重新分配报告
将批处理作业发送到slurm以便在计算集群上进行并行处理的脚本。
**输入:**none
**输出:**在"project.conf"
main build.sh
^^^^^^^^^^^^^^^^^
在
集群上。
**输入:**无
**输出:**计算节点上的临时路径和文件
/>来自多个样本的原点位置,以便更好地估计)。
**input:*$output\'u path,$doric\'u path,$ref\'u path,bin/accloc.csv
**output:**furny.csv,ptr.csv,doublingtime.csv,header.csv
pieclewisefit.py
^^^^^^^^^^^^^^^^^^^^^^^
t和先前对生成的
深度文件进行检查,以筛选出生成足够数据以生成可靠覆盖信号以估计
复制源的那些实例。一旦使用完整队列对这些变量进行了估计,就可以进一步使用这些数据为每个样本生成ptr变量。
**输入:*{reference.depth}
**输出:*{reference\{oric.npy},{reference\{reference.npy},
{reference\{coverage.png},{reference\{fit.log}
fetchseq.py
^^^^^^^^^^
此实用程序可用于从
ncbi服务器下载".fasta"引用文件。
**输入:**searchstrings.txt,
**输出:*{reference.fasta},{reference.xml},taxids.txt