无法将.xlsx文件与pandas合并

import pandas as pd file1 = 'file1.xlsx' file2 = 'file2.xlsx' sheet10 = pd.read_excel(file1, sheet_name = 0) sheet20 = pd.read_excel(file2, sheet_name = 0) conc1 = pd.concat([sheet10, sheet20], sort = False) output = pd.ExcelWriter('output.xlsx') conc1.to_excel(output, 'Sheet 1') output.save()

2条回答

网友

1楼 · 编辑于 2024-09-29 18:48:24

这里的最佳答案实际上取决于数据的确切形状。根据您提供的示例，看起来数据在两个dataframe之间的索引是相同的，这两个dataframe具有您想要保留的不同列标题。如果是这种情况，这将是最好的解决方案：

import pandas as pd

file1 = 'file1.xlsx'
file2 = 'file2.xlsx'
sheet10 = pd.read_excel(file1, sheet_name = 0)
sheet20 = pd.read_excel(file2, sheet_name = 0)

conc1 = sheet10.merge(sheet20, how="left", left_index=True, right_index=True)
output = pd.ExcelWriter('output.xlsx')
conc1.to_excel(output, sheet_name='Sheet 1', ignore_index=True)
output.save()

因为两个初始数据帧中的行数是直接匹配的，所以使用左连接、右连接、外连接还是内连接并不重要。在这个例子中，我使用了左连接。你知道吗

但是，如果两个数据帧中的行没有完全对齐，那么选择的连接方法会对输出产生巨大影响。我建议您在进一步讨论之前，先看看merge/join/concatenate上的pandas文档。你知道吗

网友

2楼 · 编辑于 2024-09-29 18:48:24

要使用pd.concat获得预期的输出，两个数据帧中的列名应该相同。这是怎么做的

# Create a 1:1 mapping of sheet10 and sheet20 columns
cols_mapping = dict(zip(sheet20.columns, sheet10.columns))

# Rename the columns in sheet20 to match with that of sheet10
sheet20_renamed = sheet20.rename(cols_mapping, axis=1)

concatenated = pd.concat([sheet10, sheet20_renamed])

相关问题更多 >

编程相关推荐

热门问题

热门文章