我有一个有4列的时间序列数据,我想按列FisherID
、DateFishing
和{}分组,并求出Weight
的总和。另外,我想用column Weight中的值减去列Total_catch
中的值,其结果将保存在名为DIFF
的新列中。并且,我想显示DIFF
列中高于0.1
的值。在
这是我的密码。在
df["DIFF"]=df.groupby(["FisherID", "DateFishing", "Total_Catch"]) ["Weight"].sum()-["Total_Catch"]>=0.1
我的数据:
^{pr2}$
Tags:
我想你在找一个
groupby
+transform
:然后,通过从
^{pr2}$Total_Catch
中减去Weight
列来找到Diff
。在或者,如果要从
Total_Catch
中减去分组的Weight
,请使用:查询行
本节以第二个选项的结果为基础。请注意,所有这些选项都将布尔掩码应用于数据帧。如果您只需要掩码,请不要将其应用于数据帧。只需应用条件并打印:
如果要提取所有有效行,有几个选项。在
df.query
boolean indexing
df.eval
df.where
和dropna
np.where
和df.iloc
:请注意,这些结果具有原始
df
的索引。如果要重置索引,请使用reset_index
:相关问题 更多 >
编程相关推荐