合并pandas数据框，无需按特定顺序排列

import pandas as pd df1 = pd.read_csv('0.csv', index_col=0, parse_dates=True, infer_datetime_format=True) df2 = pd.read_csv('1.csv', index_col=0, parse_dates=True, infer_datetime_format=True) df3 = pd.read_csv('2.csv', index_col=0, parse_dates=True, infer_datetime_format=True) data1 = pd.DataFrame() file_list = [df1, df2, df3] # fails # file_list = [df2, df3,df1] # works for fn in file_list: if data1.empty==True or fn.columns[1] in data1.columns: data1 = pd.concat([data1,fn]) else: data1 = pd.concat([data1,fn], axis=1)

1条回答

网友

1楼 · 发布于 2024-07-05 10:40:24

如果您一步一步地遍历循环，您会发现在第一次迭代中它进入if，因此data1等于df1。在第二次迭代中，它转到else，因为data1不是空的，''Temperature product barrel ValueY''不在data1.columns。在else之后，data1有一些重复的列名。在重复列名的每一行中。（两列中的一列是Nan，另一列是float）。这就是pd.concat()失败的原因。你知道吗

在尝试连接以消除重复列之前，可以聚合重复列：

for fn in file_list:
    if data1.empty==True or fn.columns[1] in data1.columns:
        # new: 
        data1 = data1.groupby(data1.columns, axis=1).agg(np.nansum)
        data1 = pd.concat([data1,fn])
    else:
        data1 = pd.concat([data1,fn], axis=1)

在那之后，你会得到

data1.shape
(30, 23)

相关问题更多 >

编程相关推荐

热门问题

热门文章