python中的管道或函数序列或过滤器,然后汇总(作为dplyr)

2024-09-19 20:26:58 发布

您现在位置:Python中文网/ 问答频道 /正文

语境化。我是一个R用户,但目前正在python(带pandas)之间切换。假设我有这个数据框

data = {'participant': ['p1','p1','p2','p3'],
        'metadata': ['congruent_1','congruent_2','incongruent_1','incongruent_2'],
        'reaction': [22000,25000,27000,35000]
        }

df_s1 = pd.DataFrame(data, columns = ['participant','metadata', 'reaction'])
df_s1 = df_s1.append([df_s1]*15,ignore_index=True)
df_s1

我想通过以下方式重现我在R(管道函数)中可以轻松完成的工作:

df_s1[(df_s1.metadata == "congruent_1") | (df_s1.metadata == "incongruent_1")].df_s1["reaction"].mean()

这是不可能的。当我将此代码拆分为部分/变量时,我才能成功:

x = df_s1[(df_s1.metadata == "congruent_1") | (df_s1.metadata == "incongruent_1")]
x = x["reaction"].mean()
x

在dplyr的方式,我会去的

ds_s1 %>% 
  filter(metadata == "congruent_1" | metadata == "incongruent_1") %>% 
  summarise(mean(reaction))

注意:我非常感谢对一个可以将我的R代码转换为Python的站点的简明引用。有几种文献可用,但格式混合,风格灵活

谢谢


Tags: 代码用户pandasdfdata方式meanmetadata
3条回答

你是说:

df_s1.loc[(df_s1.metadata == "congruent_1") | (df_s1.metadata == "incongruent_1"), "reaction"].mean()

或使用isin更简单:

df_s1.loc[df_s1.metadata.isin(["congruent_1", "incongruent_1"]), "reaction"].mean()

输出:

24500.0

我们这里有.loc

df_s1.loc[(df_s1.metadata == "congruent_1") | (df_s1.metadata == "incongruent_1"), 'reaction'].mean()
Out[117]: 24500.0

更改为isin,如Quang所述,尽量减少代码行


在R底

mean(ds_s1$reaction[ds_s1$metadata%in%c('congruent_1','incongruent_1')])

除了其他建议的解决方案外:

df_s1.query('metadata==["congruent_1","incongruent_1"]').agg({"reaction": "mean"})

 reaction    24500.0
 dtype: float64

相关问题 更多 >