我有一个N
列的数据帧。数据帧中的每个元素都在0
、N-1
范围内
例如,我的dataframce可以类似(N=3
):
A B C
0 0 2 0
1 1 0 1
2 2 2 0
3 2 0 0
4 0 0 0
我想创建一个大小为nxn的共现矩阵(如果有不同的标准名称,请更正),其中每个元素ij包含元素I和j采用相同值的次数
A B C
A x 2 3
B 2 x 2
C 3 2 x
其中,例如,matrix[0, 1]
表示A和B假设相同的值2次。
我不在乎对角线上的值
最聪明的方法是什么
Tags:
^{}
我们可以定义一个自定义的可调用函数来计算dataframe列之间的相关性,这个可调用函数将两个1D numpy数组作为其输入参数,并返回这两个数组中元素彼此相等的次数计数
我不知道最聪明的方法是什么,但我认为这是可行的:
让我们尝试通过换位和求和轴2进行广播:
e
:返回到数据帧:
new_df
:相关问题 更多 >
编程相关推荐