Numpy:理解行名称的Numpy数组概念

2024-07-05 14:09:34 发布

您现在位置:Python中文网/ 问答频道 /正文

也许是一个非常模糊的问题,但挖掘纽比的链接对我没有帮助。在

我需要用下面的二元数组的层次聚类来计算相似性矩阵,如下所示

name    val1    val2    val3    val4    val5
comp1   0   0   1   0   1
comp2   1   0   0   0   0
comp3   0   0   1   0   0
comp4   1   1   0   0   0
comp5   0   0   1   0   0

我不明白numpy中行名的概念。我可以像这样读文件

^{pr2}$

但是如何考虑行名称(这个信息非常重要)?有可能吗?在

我认为void不是一种存储二进制数组以便进一步计算相似性矩阵的正确方法?在


Tags: name链接矩阵聚类数组相似性val1comp1
1条回答
网友
1楼 · 发布于 2024-07-05 14:09:34

Numpy并不真正支持行名称。它支持列名,通过structured arrays。您可以使用dtype=[('name', object), ('val1', int), ...]之类的东西。也可以通过读取文件的第一行来实现自动化。在

genfromtxt提供给您的只是一个object类型的数组,其中一列恰好包含字符串,而其他列恰好包含整数——但所有这些列都以Python对象的形式存储,而不是高效的格式。在

您可能对pandas感兴趣,它扩展了numpy矩阵,支持带标签的行(还有许多其他东西)。^{}将很好地处理您的文件。在

相关问题 更多 >