在Pandas中添加新的DataFrame列不起作用

PA_lambda = lambda row: row.AB + row.BB + row.HBP + row.SH + row.SF OBP_lambda = lambda row: (row.H + row.BB + row.HBP) / (row.PA) if row.PA > 0 else 'NaN' AVG_lambda = lambda row: row.H / row.AB if row.AB > 0 else 'NaN'

import pandas as pd PA_lambda = lambda row: row.AB + row.BB + row.HBP + row.SH + row.SF OBP_lambda = lambda row: (row.H + row.BB + row.HBP) / (row.PA) if row.PA > 0 else 'NaN' AVG_lambda = lambda row: row.H / row.AB if row.AB > 0 else 'NaN' stat_functions = [['pa', PA_lambda], ['obp',OBP_lambda], ['avg', AVG_lambda]] def format_df(df): for func in stat_functions: df['func[0]'] = df.apply(func[1], axis=1)

3条回答

网友

1楼 · 编辑于 2024-06-17 05:31:51

由于字符串格式不正确，format_df（df）函数当前正在遍历每个函数，并将每个函数的结果保存到同一列“func”。您需要使用“f-string”更新函数的最后一行（将f放在字符串之前），以便在运行时对其进行格式化

def format_df(df):
    for func in stat_functions:
        df[f'func[0]'] = df.apply(func[1], axis=1)

网友

2楼 · 编辑于 2024-06-17 05:31:51

您不需要使用apply，您可以直接对pandas中的列执行以下操作：

df['pa'] = df['AB'] + df['BB'] + df['HBP'] + df['SH'] +df['SF']
df['obp'] = (df['H']+ df['BB']+df['HBP'])/df['PA']
df['avg'] = df['H']/df['AB']

网友

3楼 · 编辑于 2024-06-17 05:31:51

在df中创建新列时，需要正确使用func项的label元素

像这样：

for func in stat_functions: 
    df[func[0]] = df.apply(func[1], axis=1)

请注意，在数据帧中创建新列时，此代码是如何引用func[0]的值而不是字符串'func[0]'

相关问题更多 >

编程相关推荐

热门问题

热门文章