从距离矩阵计算亲和矩阵

2024-09-26 18:07:36 发布

男 | 程序猿一只，喜欢编程写python代码。

我用clustal omega得到了500个蛋白质序列的距离矩阵（它们彼此是同源的）。在

我想用亲和力传播来聚类这些序列。在

最初，因为我用手观察到距离矩阵只有0到1之间的值，0距离=100%恒等式，所以我推断我可以用(1 - distance)来获得亲和力。在

我运行我的代码，集群看起来很合理，我觉得一切都很好。。。在我读到这篇文章之前，亲和力矩阵是通过应用“热核”从距离矩阵计算出来的。当我心碎的时候。在

我是不是觉得亲和矩阵的概念不正确？有没有一种简便的计算亲和力矩阵的方法？scikit learn提供了以下公式：

similarity = np.exp(-beta * distance / distance.std())

但是什么是beta？我知道距离.std（）是距离的标准偏差。在

我现在对所涉及的概念非常困惑和迷茫（与实际的编码实现相反），所以任何帮助都是非常感谢的！在

注：我试着发邮件到Biostars.org网站但我还没有得到答案。。。在

Tags：代码概念距离序列矩阵聚类蛋白质 beta

1条回答

网友

1楼 · 发布于 2024-09-26 18:07:36

我认为1-distance和exp（-beta*distance）都是将距离转换为相似性的有效方法（尽管它们在概率框架中的解释不同）。我只会用能产生更好结果的方法。在