我想根据使用pandas的其他列中的值,在某些行和列上平均值。数据帧包含以下信息:
以下是数据帧中信息的摘录:
a1_acc a1_rt a2_acc a2_rt a3_acc a3_rt b_acc b_rt
2 780 2 830 2 690 2 950
1 630 2 750 0 0 2 890
2 710 2 810 1 740 1 820
我想做的是把所有的“a”(而不是“b”)反应时间合并起来,如果它们来自正确的回答。也就是说,我想要一个包含以下反应时间的numpy数组(或其他合适的数据结构):
^{pr2}$基于这些信息,我想计算平均反应时间(剔除偏离平均值超过3个标准偏差的反应时间)。在
任何帮助都将不胜感激。在
托马斯
我认为这不是你的数据帧的最佳形状我认为像“字母”、“数字”、“acc”、“rt”之类的列(给它们起更有意义的名称)会更容易旋转。不管怎样,按照你目前的安排:
首先,我们对
^{pr2}$.ix
进行切片,得到_acc
列,并将它们与2列进行比较:然后我们将其应用于
_rt
列的一部分:压平这个:
现在我们可以取平均值并查看标准差(可能有一个内置函数来执行此操作,但我懒得查找),在需要的地方自动忽略
NaN
值:我们使用的所有值都在3个标准偏差范围内,所以这个切割不是很有趣,但我们可以无论如何应用它:
再一次,我会在一开始重新定义你的数据,这样}。在
.ix
的丑陋可能更像{相关问题 更多 >
编程相关推荐