基于列值连接多个CSV文件，但多个CSV文件具有相同的标题，但顺序不同

SubNo Trails Height 19 1 100 19 2 400 19 3 810 7 1 911 7 2 811 7 3 811 20 1 222 20 2 222 20 3 789 1 1 : :

3条回答

网友

1楼 · 编辑于 2024-10-17 00:20:39

您的问题有点不清楚，但据我所知，您正试图获得一个csv文件，其中包含SubNo、Trails、Score和Height列（SubNo列是关键）

在这种情况下，您应该执行以下操作：

new_dataframe = left_dataframe.join(right_dataframe.set_index('SubNo'), on='SubNo', how='left')

或者：

new_dataframe = pd.merge(left_dataframe, right_dataframe, on='SubNo', how='left')

网友

2楼 · 编辑于 2024-10-17 00:20:39

请查看pandasmerge函数。您将有效地在SubNo和Trials上进行合并。一个小的代码片段是：

df1.merge(df2, how='inner')

在此步骤之后，您可能可以使用groupby()函数（可在pandas文档中找到）按主题进行切片，根据子编号对行进行分组，然后将每个组保存为单独的CSV

网友

3楼 · 编辑于 2024-10-17 00:20:39

使用merge

print (pd.merge(df1, df2, on=['SubNo','Trails'],  how='left'))

SubNo  Trails  Score  Height
1       1      4      100
1       2      4      200
7       1      9      300