在Python Pandas中连接大量CSV文件（30000）

def concatenate(): files = sort() # input is an array of filenames merged = pd.DataFrame() for file in files: print "concatinating" + file if file.endswith('FulltimeSimpleOpt.csv'): # only consider those filenames filenamearray = file.split("_") f = pd.read_csv(file, index_col=0) f.loc[:,'Vehicle'] = filenamearray[0].replace("veh", "") f.loc[:,'Year'] = filenamearray[1].replace("year", "") if "timelimit" in file: f.loc[:,'Timelimit'] = "1" else: f.loc[:,'Timelimit'] = "0" merged = pd.concat([merged, f], axis=0) merged.to_csv('merged.csv')

1条回答

网友

1楼 · 发布于 2024-10-02 22:23:36

首先列出dfs列表，然后连接：

def concatenate():
    files = sort() # input is an array of filenames
    df_list =[]
    #merged = pd.DataFrame()
    for file in files:
        print "concatinating" + file
        if file.endswith('FulltimeSimpleOpt.csv'): # only consider those filenames
            filenamearray = file.split("_")
            f = pd.read_csv(file, index_col=0)
            f.loc[:,'Vehicle'] = filenamearray[0].replace("veh", "")
            f.loc[:,'Year'] = filenamearray[1].replace("year", "")
            if "timelimit" in file:
                f.loc[:,'Timelimit'] = "1"
            else:
                f.loc[:,'Timelimit'] = "0"
            df_list.append(f)
    merged = pd.concat(df_list, axis=0)
    merged.to_csv('merged.csv')

你要做的是通过反复连接来逐步增加你的df，最好是列一个df的列表，然后一次连接所有的df

相关问题更多 >

编程相关推荐

热门问题

热门文章