一种预测多肽乳化潜力的软件包
EmulsiPred的Python项目详细描述
乳剂
基于蛋白质序列(fasta格式)和 它们对应的结果来自NetSurfP-2(http://www.cbs.dtu.dk/services/NetSurfP/)。 NetSurfP-2文件应为NetSurfP-1格式(单击“全部导出”时检索) 在NetSurfP的“服务器输出”窗口的右上角)。在
先决条件和安装
该包可以从github克隆并安装 本地或安装pip。在这两种情况下,python-3.6或 您的电脑需要安装更高版本。此外,它是 建议在新环境中安装包。在
以下命令在命令行中运行。在
1:建立一个新的环境。在
python3 -m venv EmulsiPred_env
2:进入(激活)环境。在
^{pr2}$3a:使用pip在激活环境中安装EmulsiPred。在
pip install EmulsiPred
3b:使用pip从github安装EmulsiPred。在
pip install "git+https://github.com/MarcatiliLab/EmulsiPred.git"
在运行3a或3b后,在 活化环境(在我们的例子中是EmulsiPred_env)。在
运行EmulsiPred
安装后,可从终端运行EmulsiPred或 在python脚本中。在
如上所述,EmulsiPred需要2个输入。在
- 包含蛋白质序列的fasta文件,用于检查乳化剂(称为序列.fsa). 在
- 一个NetSurfP文件,其中包含序列.fsa(称为netsurfp.txt)在
此外,还有3个可变参数。在
- o(out_dir):输出目录(默认为当前目录)。在
- 结果将只包括存在于此序列数或更高序列中的肽(默认值为1)。在
- ls(低分):结果只包括得分高于此分数的肽(默认值为2)。在
EmulsiPred可直接在终端运行 命令。在
python -m EmulsiPred -s path/to/sequence.fsa -n path/to/netsurfp.txt -o path/to/out_dir --nr_seq 1 --ls 2
此外,它可以导入并在python脚本中运行。在
importEmulsiPredasepep.EmulsiPred(sequences='path/to/sequence.fsa',netsurfp_results='path/to/netsurfp.txt',out_dir='path/to/out_dir',nr_seq=1,lower_score=2)
预测解释
预测值是相对有序的 可能是一种乳化剂。 换句话说,分数越高,机会就越大 作为乳化剂。在
- 项目
标签: