基于特定行获取Pandas中列的平均值

ID daychange monthchange trimonthchange yearchange UNITY 0.001666 0.398450 0.411581 0.689139 SSOM -0.033359 0.040816 1.174840 3.047619 PNSC -0.004953 -0.053006 0.158677 0.224932 PICT -0.002027 -0.069696 0.041143 0.310791 PIBTL -0.014848 0.129362 0.459846 0.287100

2条回答

网友

1楼 · 编辑于 2024-09-28 01:22:38

您可能需要链接filter和mean函数调用。因为您首先要选择一组要保留的行，所以需要过滤掉不需要保留的行。然后，使用新的数据集，您需要执行列平均

df.filter(lambda row: row.ID in ["UNITY", "SSOM", "PNSC"]).mean(axis = 1)

注意，我没有测试上面的代码，也不保证它能按原样工作

网友

2楼 · 编辑于 2024-09-28 01:22:38

使用loc按标签（ID列）访问一组行，然后使用axis=0计算每个时间段列的平均值。创建一个带有组名的Series，并将以前的结果附加到其中（这样组名将成为dataframe中的第一列）。将Series放在一个列表中，然后当对组的迭代完成时，转换为dataframe。要将结果放在单独的csv文件中，请使用to_csv

import pandas as pd

GROUPS = [
    ["UNITY", "SSOM", "PNSC"],
    ["SSOM", "PICT", "PIBTL"],
    ["SSOM", "PNSC", "PIBTL"],
]

df = pd.read_csv("sample.csv", sep="\s+")
df = df.set_index("ID")

data = []
for g in GROUPS:
    group_mean = df.loc[g].mean(axis=0)
    serie = pd.Series({"groupName":"-".join(g)}).append(group_mean)
    data.append(serie)

data = pd.DataFrame(data)
print(data)
data.to_csv("output.csv", index=False)

数据的输出

         groupName  daychange  monthchange  trimonthchange  yearchange
0  UNITY-SSOM-PNSC  -0.012215     0.128753        0.581699    1.320563
1  SSOM-PICT-PIBTL  -0.016745     0.033494        0.558610    1.215170
2  SSOM-PNSC-PIBTL  -0.017720     0.039057        0.597788    1.186550

相关问题更多 >

编程相关推荐

热门问题

热门文章