文件夹中有多个tsv文件。我想将每个tsv文件转换为csv文件,并将所有csv文件合并为一个巨型csv文件
customer_data = r"C:\Users\username\Desktop\folder\CustomerData_20201030031520.tsv"
customer_data = pd.read_csv(customer_data, sep='\t', low_memory=False)
这就是我读取和写入csv文件的方式。如何有效地对多个tsv文件执行此操作,而不是手动重复此操作
注意文件名模式吗?所有文件都将采用这种模式:
CustomerData_"year""month""day_number""random_digits".tsv
我的目标是将所有这些多个CSV合并到一个巨型CSV文件中
如果需要合并一组类似格式的文件,则无需实际将数据加载到内存中,我们可以直接将所有文件转储到一个文件中
下面截取的部分将检查目录
path
中的模式pattern
,并按文件名对结果列表进行排序。然后,按排序顺序将列表写入out_file
文件outfile.write("\n")
是必需的。tsv文件不能以空行结尾,否则应该对其进行注释相关问题 更多 >
编程相关推荐