残基驱动同型跨膜相互作用的机器学习预测。

thoipap的Python项目详细描述


https://raw.githubusercontent.com/bojigu/thoipapy/master/thoipapy/docs/THOIPApy_logo.png

Thoippy

跨膜同二聚体界面预测算法(thoipa)是一种用于蛋白质相互作用分析的机器学习方法。

Thoipa仅从进化序列信息预测TM同二聚体界面残基。

thoipa的设计是为了补充实验方法,以及基于能量的tm同二聚体模型。

有关详细信息,请参见thoipa wiki中的FAQ

Thoippy做什么?

  • 用blast下载蛋白质同系物
  • 提取残留物特性(例如残留物保存和极性)
  • 训练机器学习分类器
  • 验证预测性能
  • 创建残留物特性和Thoipa预测的热图

安装

pipinstallthoipapy

thoipa有一些外部依赖项,比如freeecontact和恐惧症,它们只在linux上工作。

使用Wiki中详述的“docker”实现来: *在windows或macos等平台上独立运行thoipa *在Linux上独立运行thoipa,而不在系统上安装依赖项

依赖性

我们建议使用Anaconda python distribution,它包含所有必需的python模块(numpy、scipy、pandas、biopython和matplotlib)。thoipapy目前是为python 3.6测试的。

pip应该自动安装mark teese的pytoxr包。

thoipapy依赖于命令行程序恐惧和自由接触。 这两种都只适用于Linux。thoipapy本身已经在运行windows和linux的几个不同系统上进行了测试。

发展状况

该代码已被广泛更新和注释,以供公开发布。然而,它是“原样”发布的,其中包含一些已知的问题、限制和遗留代码。 Thoipa独立预测程序当前可用。用于thoipa培训的设置文件和数据库尚未发布。

作为独立预测因子使用

对于感兴趣蛋白质的tmd接口残基预测,我们建议通过docker将thoipa作为独立程序运行,如Wiki中所述。

Thoipa也可以安装在Linux中,并用作独立的预测工具: *操作系统需要安装FreeContact、Febius和NCBI_Blast。 *应安装用于NCBIBLAST的Biopython包装器。

fromthoipapy.thoipaimportget_md5_checksum,run_THOIPA_predictionfromthoipapy.utilsimportmake_sure_path_existsprotein_name="ERBB3"TMD_seq="MALTVIAGLVVIFMMLGGTFL"full_seq="MVQNECRPCHENCTQGCKGPELQDCLGQTLVLIGKTHLTMALTVIAGLVVIFMMLGGTFLYWRGRRIQNKRAMRRYLERGESIEPLDPSEKANKVLA"out_dir="/path/to/your/desired/output/folder"make_sure_path_exists(out_dir)md5=get_md5_checksum(TMD_seq,full_seq)run_THOIPA_prediction(protein_name,md5,TMD_seq,full_seq,out_dir)

示例输出

https://raw.githubusercontent.com/bojigu/thoipapy/master/thoipapy/docs/standalone_heatmap_example.png

创建自己的机器学习预测器

有关如何在自己的数据集上训练thoipa的详细信息将在发布后发布。

importTHOIPApysettings=r"D:\data\THOIPApy_settings.xlsx"THOIPApy.run(settings)

许可证

thoipapy是在许可的mit许可下发布的自由软件。

贡献

thoipapy尚未正式发布。然而,关于独立版本的安装和使用的反馈是值得赞赏的。直接给我们发邮件,或者在github中发起一个问题。

接触

有关联系方式,请访问慕尼黑大学相关网站:

作者:Frishman lab,慕尼黑大学,维汉台山校区Bo Zeng

进一步编码和监督:Langosch lab,慕尼黑大学,维汉台山校区Mark Teese

引文

要添加的引文。 完整学分:Bo Zeng、Yao Xiao、Dmitrij Frishman、Dieter Langosch、Mark Teese

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java RandomAccessFile:在循环中写入(字节)或写入(字节数组),哪个更有效?   从命令行运行maven+eclipse的java   在java中无法用正则表达式替换字符串   java Eclipse输出字符与键盘键值不同   JavaWeb服务(服务器客户端)。服务器使用外部项目   java试图制作“夜间模式”过滤器   java Box2d加速和限制车轮速度   javascript JQuery DataTable页面长度在第1页之后不受尊重   java如何使用DefaultCellEditor使JT的列只能得到数字,并在点后用两个符号进行四舍五入?   无法在Java中实例化泛型类型实例   java My code在我的代码中出现数组越界异常,但在前两次输入出错后,它将运行并崩溃   字符串的Java代码压缩和解压缩   SpringBootJava。lang.IllegalStateException:无法解析公共组织中的参数[0]。springframework。http。响应<java。lang.Object>   java在安卓中访问容器的子级   为什么Java不能从InputStream正确地重新创建此映像?