proteomexchange存储库的python接口
ppx的Python项目详细描述
ppx:proteomexchange存储库的python接口
概述
ppx
包提供了从python访问ProteomeXchange存储库的简单方法。使用proteomexchange标识符,用户可以检索与项目相关联的元数据,并从PRIDE下载项目文件。
ppx
主要基于laurent gatto(Bioconductor和GitHub)的rpx
r包。
有关完整的文档和示例,请访问:https://ppx.readthedocs.io
安装
ppx
是pip
可安装的。ppx
包可用于python 3.6+,并且仅依赖于python标准库中的包。
pip3 install ppx
示例
首先使用有效的proteomexchange标识符创建pxdataset对象:
dat=PXDataset("PXD000001")
然后,我们可以从pxdataset中提取有关蛋白质交换项目的各种数据:
dat.pxref()# ['Gatto L, Christoforou A. Using R and Bioconductor for proteomics data# analysis. Biochim Biophys Acta. 2014 1844(1 pt a):42-51']dat.pxurl()# 'ftp://ftp.pride.ebi.ac.uk/pride/data/archive/2012/03/PXD000001'dat.pxtax()# ['Erwinia carotovora']dat.pxfiles()# ['F063721.dat', 'F063721.dat-mztab.txt',# 'PRIDE_Exp_Complete_Ac_22134.xml.gz', 'PRIDE_Exp_mzData_Ac_22134.xml.gz',# 'PXD000001_mztab.txt', 'README.txt',# 'TMT_Erwinia_1uLSike_Top10HCD_isol2_45stepped_60min_01-20141210.mzML',# 'TMT_Erwinia_1uLSike_Top10HCD_isol2_45stepped_60min_01-20141210.mzXML',# 'TMT_Erwinia_1uLSike_Top10HCD_isol2_45stepped_60min_01.mzXML',# 'TMT_Erwinia_1uLSike_Top10HCD_isol2_45stepped_60min_01.raw',# 'erwinia_carotovora.fasta', 'generated']
最后,我们可以下载感兴趣的文件:
# Download "README.txt" to the "test" directorydat.pxget(files="README.txt",dest_dir="test")