graftm是一个用于识别和分类从亚基因组数据集读取的标记基因的管道。

graftm的Python项目详细描述


#graftm
graftm是一个工具,可用于发现在亚基因组、亚转录体和整个基因组中感兴趣的基因。

graftm将使用模块化基因包,使用hmmsearch(hmmer)搜索提供的序列,并将识别的序列放入预先构建的系统发育树中。它提供了快速、系统发育信息丰富的群落概况和基因组注释。graftm提供工具:
*创建和更新自定义基因包,以便与graftm一起使用
*装饰树,当然..
*使用这些graftm包分析序列数据集
转到[graftm页](http://geronimp.github.io/graftm/)了解更多一般信息。


\pip安装
graftm可以通过pip安装:
```
pip安装graftm
```
但是,要使用graftm的所有功能,需要一些额外的二进制应用程序:
*orfm v.>;=0.2.0(https://github.com/wwood/orfm)
*hmmer v.>;=3.1b1(http://hmmer.janelia.org/)
*fxtract(https://github.com/ctskennerton/fxtract)
*pplacer v.>;=2.6.32(http://matsen.fhcrc.org/pplacer/)
*krona v.>;=2.4(http://sourceforge.net/p/krona/home/krona/)
*mafft v.>;=7.22(http://mafft.cbrc.jp/)
*diamond v.>;=0.9(https://github.com/bbuchfink/diamond)所用diamond的版本必须与用于生成gpkgs的版本匹配,并且要运行测试,需要特定的版本。

你还需要
*fastreemp(http://www.microbesonline.org/fastree/)


graftm docker映像是可移植的容器,包含graftm代码及其所有python和非python依赖项,允许graftm在安装了docker的任何平台上运行。有关如何下载和运行Graftm Docker映像的详细信息,可以在[Graftm Docker]Github页面或[Docker Hub页面](https://hub.docker.com/u/geronimp/)。

使用ace包存储库安装。安装[gnu guix]后(https://www.gnu.org/software/guix/)
````
git克隆https://github.com/ecogenomics/ace guix
guix包路径=ace guix guix包--安装graftm
```

graftm可以通过[conda/bioconda]安装(https://anaconda.org/bioconda/graftm)。

包括:

*16srrna包
*15个单拷贝核糖体蛋白标记基因
*产甲烷标记mcra

你想要的包,只要按如下方式解压缩:

````
tar-xvzf my.tar.gz
````
,你应该很好地去!




将示例文件另存为`/tmp/eg.fasta`,内容如下:
```
>;229854
gagttgagtcgtgcgattgaaccgtagcatagcatagcatagcatagcatagcatagcatagcatagcatagcatagcatgacttagctgct
aagttgaggtggaggatagaggatagagaggatagcatagcatagcatagcatagcatagcatagcatagcatagcatagcatagcatagcatagcatagcatagcatagcatagcatagactgggaactgggaactgaactgaactgaactcaag
然后我们可以使用graftm61%otu聚类graftm包检测并分类该序列。运行graftm可能看起来像这样:
```
$graftm graft--forward/tmp/eg.fasta--graftm--package/path/to/4.01.2013--u08--greengenes--u61--otus.gpkg/--output--egraftm目录移植物0.9.2




>>->>>>>;__|
--
-上午9:52:06信息:将读取与参考包数据库对齐
12/02/2015 09:52:06信息:从对齐中筛选出0个短序列
12/02/2015 09:52:06 AM信息:剩余1个序列
12/02/2015 09:52:06 AM信息:将读取放入系统发生树
12/02/2015 09:52:07 AM信息:放置完成
12/02/2015 09:52:07 AM信息:读取分类
12/02/2015 09:52:07 AM信息:读取分类
12/02/2015 09:52:07 AM信息:写入摘要表
12/02/2015 09:52:07 AM信息:写入生物模型文件
12/02/2015 09:52:07 AM信息:构建摘要Krona绘图
12/02/2015 09:52:07 AM信息:清理
12/02/2015 09:52:07 AM信息:完成,感谢使用Graftm!
```
这会创建一个包含结果的文件夹'e g.graftm'。

在这里,我们将从greengenes提供的高度简化的
集合中创建一个16s包。这里的数据在graftm的
[示例数据/创建](https://github.com/geronimp/graftm/tree/master/example\data/create)文件夹中提供。格拉夫姆0.9.5





/
>;a/
-/
>;b
--->;gpkg
>;C uuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuuu分类
08/02/2016 09:18:48 AM信息:检查重复序列
08/02/2016 09:18:48 AM信息:对齐序列以创建对齐的FASTA文件
08/02/2016 09:19:08 AM信息:从对齐构建HMM
08/02/2016 09:19:09 AM信息:从对齐
08/02/2016 09:19:09 AM信息:剩余22个序列
08/02/2016 09:19:09 AM信息:检查不正确或片段读取
08/02/2016 09:19:09 AM信息:从搜索HMM中删除0个序列,这些序列在分类文件中的6列冗余
08/02/2016 09:19:26 AM信息:从对齐中生成HMM
08/02/2016 09:19:28 AM信息:从对齐中筛选0个短序列
08/02/2016 09:19:28 AM信息:剩余22个序列
08/02/2016 09:19:28 AM警告:在4363260的序列中发现一个非标准字符:例如"w"
08/02/2016 09:19:28 AM信息:重复数据消除序列
08/02/2016 09:19:28 AM信息:删除0个序列作为重复,留下22个不相同的序列
08/02/2016 09:19:28 AM信息:构建树
08/02/2016 09:19:29 AM信息:构建序列信息And taxonomy文件来自input taxonomy
08/02/2016 09:19:29 am info:创建参考包
08/02/2016 09:19:29 am info:尝试运行taxit create with rerooting capabilities
08/02/2016 09:19:29 am info:创建diamond数据库
08/02/2016 09:19:29 am info:编译gpkg
08/02/2016 09:19:29 am信息:清理
08/02/2016 09:19:29 am信息:测试gpkg包工作
08/02/2016 09:19:37 am信息:完成
`````

"create"有许多可选参数,可用于修改生成gpkgs的过程。


happy嫁接!

HL = ENα!论坛/supportm)公共帮助论坛。
软件由[joel a.boyd](http://ecogenomic.org/users/joel-boyd)(geronimp)和[ben j.woodcroft](http://www.ecogenomic.org/users/ben-woodcroft)(wwood)在[澳大利亚生态基因组学中心](http://ecogenomic.org)
在gpl3下发布-见license.txt获取许可详细信息

\graftm已发布-请在

>;**graftm:一个可扩展的、系统发育相关的基因分类工具**。
>;joel a boyd ben j woodcroft gene w tyson
>;核酸研究,第46卷,第10期,2018年6月1日,第E59页,https://doi.org/10.1093/nar/gky174

有关详细信息,请参见license.txt。graftm利用了来自[silva数据库](https://www.arb-silva.de)的18srrna序列,该数据库采用了双重授权模式。有关详细信息,请参见silva.license.txt。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
我可以用C++代码使用java代码吗?   java使用JSR303在派生类中提供更具体的约束   java在这个查找唯一路径数算法中我做错了什么?   java如何为2个不同的服务提供商使用2个不同的SSL证书?   java在Gridview上绘制文本   java使用连接for循环构建字符串名   java StringBuilder拆分无法处理某些文件   java事件关注EditText   Java Web Start“找不到URL的缓存资源”   java程序从命令行运行的速度比在Eclipse中慢   java为什么HttpServletRequest会截断#字符上的url输入?   java自定义折叠工具栏平滑标题大小调整   使用Mockito对安卓 java中调用另一个静态函数的函数进行单元测试   http在java客户机中使用cachecontrol头   java如何使用。是否使用Delimiter从输入文件中排除标点符号和数字?   使用上下文作为参数/参数的java   java更有效地从Jar中提取文件   java为多个JButton提供相同的actionListener