也许是一个非常模糊的问题,但挖掘纽比的链接对我没有帮助。在
我需要用下面的二元数组的层次聚类来计算相似性矩阵,如下所示
name val1 val2 val3 val4 val5
comp1 0 0 1 0 1
comp2 1 0 0 0 0
comp3 0 0 1 0 0
comp4 1 1 0 0 0
comp5 0 0 1 0 0
我不明白numpy中行名的概念。我可以像这样读文件
^{pr2}$
但是如何考虑行名称(这个信息非常重要)?有可能吗?在
我认为void不是一种存储二进制数组以便进一步计算相似性矩阵的正确方法?在
Tags:
Numpy并不真正支持行名称。它支持列名,通过structured arrays。您可以使用
dtype=[('name', object), ('val1', int), ...]
之类的东西。也可以通过读取文件的第一行来实现自动化。在genfromtxt
提供给您的只是一个object
类型的数组,其中一列恰好包含字符串,而其他列恰好包含整数——但所有这些列都以Python对象的形式存储,而不是高效的格式。在您可能对pandas感兴趣,它扩展了numpy矩阵,支持带标签的行(还有许多其他东西)。^{} 将很好地处理您的文件。在
相关问题 更多 >
编程相关推荐