我有以下数据框
Style Land Code Assessment_per_living
0 Cape 1010 94.933749
1 Cape 1010 95.235000
2 Cape 1010 109.222000
3 Colonial 1010 64.175109
4 Colonial 1010 77.270968
5 Cape 1011 80.856481
6 Cape 1011 58.060029
7 Colonial 1011 45.572414
8 Colonial 1011 67.856000
9 Colonial 1011 79.564000
10 Ranch 1011 52.769231
11 Ranch 1011 57.810434
12 Ranch 1011 52.472952
13 Colonial 1012 107.820248
14 Colonial 1012 84.827050
15 Colonial 1012 63.626108
16 Colonial 1012 51.931994
17 Ranch 1012 109.641711
18 Ranch 1012 88.243000
19 Ranch 1012 74.783000
我可以做下面的groupby
n\u hood\u cost\u count=数据框groupby([“土地代码”,“风格])[“生活评估”].mean()
产生了以下数据帧
Land Code Style
1010 Cape 99.796916
Colonial 70.723038
1011 Cape 69.458255
Colonial 64.330805
Ranch 54.350872
1012 Colonial 77.051350
Ranch 90.889237
我正在尝试添加一个新列,该列将坚持多级groupby,但在Assessment\u per\u living列中返回大于平均值的单个项目。例如,数据帧中的行2将是1(传递掩码),而行0和1则不是。我想返回大于平均值的所有groupby集(1010/Cape、1010/Colonial、1011/Cape、1011/Colonial、1010/Ranch等)的结果,并将其保存在新的数据帧中。有人能教我怎么做吗?你知道吗
可以使用
merge
,然后使用条件。你知道吗输出
可以将^{} 用于长度与} 和上次使用^{} 进行比较:
df
相同的means
,与^{如果只需要前2列,则为唯一对添加^{} 和^{} :
相关问题 更多 >
编程相关推荐