Pandas，用什么方法？

A B C D E F G run_1_clust_1.out: GLU 2 HN 2.07 3851 -0.90 GLY 1 HN 2.09 3196 -0.90 3 HN 2.05 3553 -0.90 HT1 2.12 2828 -0.91 HT2 2.05 3516 -0.90 run_1_clust_2.out: GLU 2 HN 2.12 1940 -0.90 GLY 1 HN 2.33 4030 -0.90 3 HN 2.43 3994 -0.90 HT1 2.11 2833 -0.91 HT2 2.05 3242 -0.90

run_1_clust_1.out: GLY 1 HN 2.09 3196 -0.90 run_1_clust_2.out: GLY 1 HN 2.33 4030 -0.90 run_1_clust_1.out: GLU 2 HN 2.07 3851 -0.90 run_1_clust_2.out: GLU 2 HN 2.12 1940 -0.90 run_1_clust_1.out: GLY 3 HN 2.05 3553 -0.90 run_1_clust_2.out: GLY 3 HN 2.43 3994 -0.90 run_1_clust_1.out: GLY 3 HT1 2.12 2828 -0.91 ....

import pandas as pd writer = pd.ExcelWriter('output.xlsx', engine='xlsxwriter') xl = pd.ExcelFile('test.xlsx') df = xl.parse("Sheet1") df.columns = df[['a','b','c','d','e','f','g']] df = df.groupby(['b','c','d']) df.to_excel(writer, sheet_name="Sheet1") writer.save()

1条回答

网友

1楼 · 发布于 2024-09-29 05:32:06

试试这个。主要的区别是：我指定了一个对分组和重置索引执行的计算，以便输出是一个数据帧。你知道吗

import pandas as pd

writer = pd.ExcelWriter('output.xlsx', engine='xlsxwriter')

xl = pd.ExcelFile('test.xlsx')
df = xl.parse("Sheet1")
df.columns = df[['a','b','c','d','e','f','g']]

group_cols = ['b','c','d']
sum_cols = ['e', 'f', 'g']

df = df[group_cols+sum_cols].groupby(group_cols).sum().reset_index()
df.to_excel(writer, sheet_name="Sheet1")

writer.save()

相关问题更多 >

编程相关推荐

热门问题

热门文章