我有一个excel文件,如下所示:
A B C D E F G
run_1_clust_1.out: GLU 2 HN 2.07 3851 -0.90
GLY 1 HN 2.09 3196 -0.90
3 HN 2.05 3553 -0.90
HT1 2.12 2828 -0.91
HT2 2.05 3516 -0.90
run_1_clust_2.out: GLU 2 HN 2.12 1940 -0.90
GLY 1 HN 2.33 4030 -0.90
3 HN 2.43 3994 -0.90
HT1 2.11 2833 -0.91
HT2 2.05 3242 -0.90
我想按B、C和D列对E、F和G列进行分组。对于如下输出:
run_1_clust_1.out: GLY 1 HN 2.09 3196 -0.90
run_1_clust_2.out: GLY 1 HN 2.33 4030 -0.90
run_1_clust_1.out: GLU 2 HN 2.07 3851 -0.90
run_1_clust_2.out: GLU 2 HN 2.12 1940 -0.90
run_1_clust_1.out: GLY 3 HN 2.05 3553 -0.90
run_1_clust_2.out: GLY 3 HN 2.43 3994 -0.90
run_1_clust_1.out: GLY 3 HT1 2.12 2828 -0.91
....
我正在使用pandas,但我不知道为什么AttributeError告诉我使用“apply”方法。你知道吗
import pandas as pd
writer = pd.ExcelWriter('output.xlsx', engine='xlsxwriter')
xl = pd.ExcelFile('test.xlsx')
df = xl.parse("Sheet1")
df.columns = df[['a','b','c','d','e','f','g']]
df = df.groupby(['b','c','d'])
df.to_excel(writer, sheet_name="Sheet1")
writer.save()
试试这个。主要的区别是:我指定了一个对分组和重置索引执行的计算,以便输出是一个数据帧。你知道吗
相关问题 更多 >
编程相关推荐