我基本上没有熊猫的经验,我试图强迫自己更多地使用它
我正试图基于一个特定列将多个数据帧的“计数”合并起来,以创建一个计数矩阵。我通常使用好的python旧词典来完成这项工作,但如果有一种简单的方法可以使用pandas来完成这项工作,我会对学习感兴趣
我有多个数据帧。它们的大小不一样。GeneID和geneName基本上是一样的。只是识别基因的不同方法
我的数据帧如下所示:
数据框架1:
geneID geneName count
0 A123 ABC 202
1 B456 DEF 30
2 C789 GHI 265
数据框架2:
geneID geneName count
0 X999 FOO 700
1 B456 DEF 606
2 C789 GHI 777
如果任何数据帧中均不存在基因名称/基因ID,则其在矩阵文件中的计数值应为“0”
以下是连接计数后的预期结果:
geneID geneName df1 df2 df3 ...
0 A123 ABC 202 0
1 B456 DEF 30 606
2 C789 GHI 265 777
3 X999 FOO 0 700
提前感谢您提供的任何解决方案和学习技巧
试试
pd.concat
:输出:
或者
concat
然后pivot_table
:或者在
concat
中使用选项key
的类似方法:以下是另一种方法:
相关问题 更多 >
编程相关推荐