我以前从未使用过pandas或numpy,我想知道在pandas中构造标记邻接矩阵的惯用方法是什么
我的数据的形状与此相似。每种"uL22"
类型的东西都是一种蛋白质,而数组是这种蛋白质的邻居。因此(在下面的示例中)邻接矩阵在bL31
行、列中都有1,反之亦然
我的问题有两个:
邻接矩阵的实际维数由一组蛋白质名称决定,这些名称通常比nbrtree
中包含的名称大得多,因此我想知道将我的nbrtree
数据映射到该集合的最佳方法是什么,比如对应于100
蛋白质邻域关系的100
比100
矩阵
我不太确定如何将这100种蛋白质的名称(即uL32
等)与这个矩阵的行和列“绑定”,这样当我开始移动名称周围的行时,名称就会相应地移动。(我计划将邻接矩阵重新设置为块对角结构)
"nbrtree": {
"bL31": ["uL5"],
"uL5": ["bL31"],
"bL32": ["uL22"],
"uL22": ["bL32","bL17"],
...
"bL33": ["bL35"],
"bL35": ["bL33","uL15"],
"uL13": ["bL20"],
"bL20": ["uL13","bL21"]
}
>>>len(nbrtree)
>>>40
我确信这是人们每天都在执行的操作,我只是不太熟悉数据帧如何正常工作,所以我可能在寻找一些非常明显的东西。 非常感谢你
我不完全理解你的问题,但从我得到的信息来看,请尝试一下这段代码
此代码的输出为
注意这里的邻接矩阵是非对称的,因为我已经获取了一些随机数据
要将标签吸收到数据框中,请更改为以下内容
相关问题 更多 >
编程相关推荐