我用clustal omega得到了500个蛋白质序列的距离矩阵(它们彼此是同源的)。在
我想用亲和力传播来聚类这些序列。在
最初,因为我用手观察到距离矩阵只有0到1之间的值,0距离=100%恒等式,所以我推断我可以用(1 - distance)
来获得亲和力。在
我运行我的代码,集群看起来很合理,我觉得一切都很好。。。在我读到这篇文章之前,亲和力矩阵是通过应用“热核”从距离矩阵计算出来的。当我心碎的时候。在
我是不是觉得亲和矩阵的概念不正确?有没有一种简便的计算亲和力矩阵的方法?scikit learn提供了以下公式:
similarity = np.exp(-beta * distance / distance.std())
但是什么是beta?我知道距离.std()是距离的标准偏差。在
我现在对所涉及的概念非常困惑和迷茫(与实际的编码实现相反),所以任何帮助都是非常感谢的!在
注:我试着发邮件到Biostars.org网站但我还没有得到答案。。。在
我认为1-distance和exp(-beta*distance)都是将距离转换为相似性的有效方法(尽管它们在概率框架中的解释不同)。我只会用能产生更好结果的方法。在
相关问题 更多 >
编程相关推荐