我有一个数据帧:
name age city zipcode
Jon 22 CA 0002
Raj 34 GG 3454
... .. .. ....
... .. .. ....
我想编写一个函数Preprocess(df,[params]),这样预处理应该只在数据帧的列上进行,这些列将在params中传递
例如
def preprocess(df,params):
name_list = df['name'].tolist()
mean_age = df['age'].mean()
city_list = df['city'].tolist()
zipcode_list = df['zipcode'].tolist()
return [name_list, mean_age, city_list, zipcode_list]
result = preprocess(df,['age','city'])
我要寻找的是,如果我只通过年龄和城市我希望只对这两列进行预处理
ie
mean_age = df['age'].mean()
city_list = df['city'].tolist()
一种方法是使用if-else/尝试catch
我正在寻找解决这个问题的最佳方法或是一种类似Python的方法
目前没有回答
相关问题 更多 >
编程相关推荐