质谱蛋白质组学后处理工具
msstitch的Python项目详细描述
#msstitch–ms蛋白质组学后处理实用程序
鸟枪蛋白质组学有许多可用于鉴定的生物信息学工具 以及肽的定量,以及随后的蛋白质推断。
这些脚本是为数年前在组合时搔痒而编写的 现有的工具,并充当小命令行可运行的程序。 例如向psm表添加值、操作percolator结果或分组 蛋白质。它们能够将多种不同的输出格式组合到 完成输出。
我们目前支持自己运行的工具,但这些工具很容易扩展 包括更多的工具输出格式。
##工具
- _ msslookup-从光谱、搜索和量化数据创建sqlite数据库
- _ msspecolator_uuu-拆分、合并、筛选percolator xml结果,并运行qvality
- _ mspsmtable_uu-从msgf+筛选、拆分、合并和保护psm表上的组。还添加具有额外数据的列(quant、percolator、genes等)
- _ msspeptable创建和操作肽表(合并、定量数据添加等)
- _ msprotable_uu-idem用于蛋白质表,包括测定蛋白质fdr
###MS查找 生成各种ms数据的sqlite数据库文件。可用于存储统计数据 或多个实验样本集的量化数据,然后合并。但是 由于数据库引擎的强大功能,还可以进行蛋白质分组和序列过滤。
示例:存储一个多集制表符分隔的psm表:
msslookup psms-i psmtable.txt–dbfile spectralookup.sql–spectracol 2–fasta ensembl80.fa–map ens80_biomart.txt
###MSS渗透仪 对Percolator输出XML执行各种操作,例如拆分为目标和诱饵, 合并、过滤肽、运行qvality并将qvality输出统计信息重新分配给 现有渗滤器输出。
示例:根据合并的percolator文件的最佳分数筛选唯一的肽
msspector filteruni-i percolator.xml-o filteredpercolator.xml
###MSPSMTABLE软件 用于修改由msgf+生成的制表符分隔的psm表(支持) 或其他工具。
示例:将ms2 quant数据从sqlite lookup添加到psm表(由mslookup生成)
mspsmtable quanttsv-i psmtable.txt–dbfile db.sqlite–isobalic-o quantpsms.txt
示例2:将psm表拆分为“biological set”列上的多个表
mspsmtable splittsv-i psmtable.txt–bioset
###MSS可编程 创建和修改肽表
示例:通过过滤来自psm表的最佳肽并删除等压定量数据来创建肽表。 通过对给定肽序列取最高ms1量来保留ms1量数据。
msspeptable psm2pep-i psmtable.txt–spectracol 2–scorecolpattern SVM–ms1quantcolpattern area–isobquantcolpattern tmt10plex-o peptinetable.txt
示例:在肽表中创建具有线性建模q值的列
msspipetable modelqvals-i peptides.txt–qcolpattern“^q-value”–scorecolpattern svm-o peptides戋linearmodels.txt
###MSSProtTable公司 创建和修改蛋白质表,并在这些表上运行qvality以进行FDR计算
示例:将最佳评分肽添加到蛋白质表中(Savitsky等人2014年的Q评分)
mssprotetable bestpeptide-i proteins.txt–peptable peptides.txt–scorecolpattern SVM–logscore-o proteins_bestpep.txt
示例:使用q分数将蛋白质选择的fdr添加到蛋白质表中
mssproteable fdr-i proteins.txt–decoyfn decoyproteins.txt–targetfasta ensembl80.fa–decoy fasta decoy_ensembl80.fa–picktype fasta-o proteins_fdr.txt