将多个CSV文件中的一行附加到另一个CSV文件

for csvname in os.listdir("NewTables"): if csvname.endswith(".csv"): df1 = pd.read_csv("NewTables/"+ csvname) name1 = os.path.splitext(filename)[0] for file in os.listdir(): if file.endswith(".csv"): df2 = pd.read_csv(file) D = df2[df2["denominazione_regione"] == name1 ] df1.append(D, ignore_index = True) df1.to_csv("NewTables/"+ csvname)

1条回答

网友

1楼 · 发布于 2024-10-02 20:30:51

我不会在这里使用熊猫，因为这里几乎没有数据处理，主要是文件处理。所以我会坚持使用csv模块

我会查看第一个目录中的csv文件，然后一次处理一个。对于每一行，我只需将其附加到文件中，并在第二个文件夹中使用相关名称。我假设区域的数量相当小，所以我会保持第二个文件夹中的文件处于打开状态，以节省每行的打开/关闭时间

代码可以是：

import glob
import os.path
import csv

outfiles = {}   # cache the open files and the associated writer in 2nd folder
for csvname in glob.glob('*.csv'):     # loop over csv files from 1st folder
    with open(csvname) as fdin:
        rd = csv.DictReader(fdin)      # read the file as csv
        for row in rd:
            path = "NewTables/"+row['denominazione_regione']+'.csv'
            newfile = not os.path.exists(path)   # a new file?
            if row['denominazione_regione'] not in outfiles:
                fdout = open(path, 'a', newline='')  # not in cache: open it
                wr = csv.DictWriter(fdout, rd.fieldnames)
                if newfile:
                    wr.writeheader()   # write header line only for new files
                outfiles[row['denominazione_regione']] = (wr, fdout) # cache
            wr = outfiles[row['denominazione_regione']][0]
            wr.writerow(row)           # write the row in the relevant file
for file in outfiles.values():        # close every outfile
    file[1].close()

相关问题更多 >

编程相关推荐

热门问题

热门文章