使用Pandas&Pivot表如何使用column（level）groupby sum值进行下一步分析？

Village Workers Level Aagar 10 Small Dhagewadi 32 Small Sherewadi 34 Small Shindwad 42 Small Dhokari 84 Medium Khanapur 65 Medium Ambikanagar 45 Medium Takali 127 Large Gardhani 122 Large Pi.Khand 120 Large Pangri 105 Large

1条回答

网友

1楼 · 发布于 2024-07-04 16:18:36

您可以使用：

^{}与{}相同长度的列
用^{}除以sum和^{}
另一个transform，带有{}
上次自定义函数

df['Sum_Level_wise'] = df.groupby('Level')['Workers'].transform('sum')
df['Probability'] = df['Sum_Level_wise'].div(df['Workers'].sum()).round(2)
df['Sample'] = df['Probability'] * df.groupby('Level')['Workers'].transform('size')
df['Selected villages'] = df['Sample'].apply(np.ceil).astype(int)

df['Selected village'] = df.groupby('Level')
                           .apply(lambda x: x['Village'].head(x['Selected villages'].iat[0]))
                           .reset_index(level=0)['Village']
df['Selected village'] = df['Selected village'].fillna('')
print (df)
        Village  Workers   Level  Sum_Level_wise  Probability  Sample  \
0         Aagar       10   Small             118         0.15    0.60   
1     Dhagewadi       32   Small             118         0.15    0.60   
2     Sherewadi       34   Small             118         0.15    0.60   
3      Shindwad       42   Small             118         0.15    0.60   
4       Dhokari       84  Medium             194         0.25    0.75   
5      Khanapur       65  Medium             194         0.25    0.75   
6   Ambikanagar       45  Medium             194         0.25    0.75   
7        Takali      127   Large             474         0.60    2.40   
8      Gardhani      122   Large             474         0.60    2.40   
9      Pi.Khand      120   Large             474         0.60    2.40   
10       Pangri      105   Large             474         0.60    2.40   

    Selected villages Selected village  
0                   1            Aagar  
1                   1                   
2                   1                   
3                   1                   
4                   1          Dhokari  
5                   1                   
6                   1                   
7                   3           Takali  
8                   3         Gardhani  
9                   3         Pi.Khand  
10                  3

您可以尝试使用自定义函数进行调试：

^{pr2}$

相关问题更多 >

编程相关推荐

热门问题

热门文章

使用Pandas&Pivot表如何使用column（level）groupby sum值进行下一步分析？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >