如何找到各种.csv文件的所有列的值的平均值，使用python只保持单个标题和第一个标签列相同？

awk ' BEGIN {FS=OFS=","} FNR==1 {header=$0} # header line FNR>1 { sum[FNR,1] = $1 # names column for (j=2; j<=NF; j++) { sum[FNR,j] += $j } } END { print header files = ARGC - 1 # number of csv files for (i=2; i<=FNR; i++) { $1 = sum[i,1] # another treatment for the 1st column for (j=2; j<=NF; j++) { $j = sum[i,j] / files } print } }' *.csv

2条回答

网友

1楼 · 编辑于 2024-10-16 20:47:48

展开pandas选项posted by Mr Morgan，您还可以使用：

filename_list=['csv1.csv','csv2.csv']
dfs=[]
for fname in filename_list:
    dfs.append(pd.read_csv(fname,index_col=0))

averages = pd.concat([each.stack() for each in dfs],axis=1)\
             .apply(lambda x:x.mean(),axis=1)\
             .unstack()

averages.to_csv("csvAvg.csv")

网友

2楼 · 编辑于 2024-10-16 20:47:48

如果只想使用标准库，示例如下：

导入csv 从统计导入平均值

filename1 = 'f1.csv'
filename2 = 'f2.csv'
output = 'output.csv'

with open(filename1, 'r') as f1, open(filename2, 'r') as f2, open(output, 'r') as out:
    r1 = csv.reader(f1)
    r2 = csv.reader(f2)
    w = csv.writer(out)
    w.writerows(next(r1))
    next(r2)

    for line1, line2 in zip(r1, r2):
        w.writerows([line1[0]] + list(map(lambda a: (a[0]+a[1])//2, zip(line1[1:], line2[1:]))))

如果您想使用pandas，这里是：

作为pd导入

df1 = pd.read_csv('filename1.csv', index_col=0, header=0)
df2 = pd.read_csv('filename2.csv', index_col=0, header=0)

out = (df1 + df2) // 2

out.to_csv('output.csv')

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何找到各种.csv文件的所有列的值的平均值，使用python只保持单个标题和第一个标签列相同？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >