使用pandas DataFrame比较两个文件\u csv以找出差异，并将F2连接到F1中

F1: gene disease 0 g1 d1 1 g1 d2 2 g1 d3 3 g2 d2 4 g2 d3 5 g2 d4 6 g3 d2 7 g3 d4 8 g4 d1 9 g4 d3 F2: gene phenotype 0 g1 ph1 1 g1 ph2 2 g2 ph2 3 g2 ph3 4 g2 ph4 5 g3 ph4 6 g4 ph1 7 g4 ph3 8 g5 ph4 9 g6 ph2

1条回答

网友

1楼 · 发布于 2024-09-26 22:53:13

基因与表型之间存在一对多关系，基因与疾病之间存在一对多关系。如果你加入基因，将会有一个多对多。参见示例输出。这就是你要找的吗？你知道吗

data = [
    ["g1", "d1"], 
    ["g1", "d2"],
    ["g1", "d3"],
    ["g2", "d2"], 
    ["g2", "d3"]
]
f1 = pd.DataFrame(data, columns={"gene", "disease"})


data = [
    ["g1", "ph1"], 
    ["g1", "ph2"],
    ["g2", "ph2"], 
    ["g2", "ph3"]
]
f2 = pd.DataFrame(data, columns={"gene", "phenotype"})

f1.merge(f2)



idx gene disease phenotype
0   g1  d1  ph1
1   g1  d1  ph2
2   g1  d2  ph1
3   g1  d2  ph2
4   g1  d3  ph1
5   g1  d3  ph2
6   g2  d2  ph2
7   g2  d2  ph3
8   g2  d3  ph2
9   g2  d3  ph3

相关问题更多 >

编程相关推荐

热门问题

热门文章

使用pandas DataFrame比较两个文件\u csv以找出差异，并将F2连接到F1中

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >