我想用比例分配法找出每一个层次上会有多少样本。在
我一共有3个级别:【小,中,大】。在
首先,我要计算这3级的总和
接下来,我要找出这三个层次的概率
下一步,我想用这个概率答案乘以这3个水平的样本数
最后一步是:每一级都将选择样本作为顶级村庄。在
数据:
Village Workers Level
Aagar 10 Small
Dhagewadi 32 Small
Sherewadi 34 Small
Shindwad 42 Small
Dhokari 84 Medium
Khanapur 65 Medium
Ambikanagar 45 Medium
Takali 127 Large
Gardhani 122 Large
Pi.Khand 120 Large
Pangri 105 Large
让我解释一下,我附上excel照片
第一步:我想得到级别->小、中、高的和值。i、 e(10+32+34+42)=118(小水平)。在
在下一步中,我想找出每一级的概率,四舍五入到小数点后两位。 i、 e(118/786)=0.15(小水平)。在
用每个层次的长度(大小)乘以概率来计算每个层次上抽取了多少个样本(村庄)。在
也就是说,对于中等水平,我们有0.25的概率,我们有3个村庄处于中等水平。因此,0.25*3=0.75将从中等水平取样。 因此,从中等水平上取下一个0.75~1个样本,四舍五入到下一个整数,取该水平的顶层村。所以,在中等水平的“Dhokri”村将被选中
我做了一些工作
^{pr2}$我用这个命令来计算等级的总和。接下来要做什么我很困惑
df=df.groupby(['level'])['Workers'].aggregate(['sum']).unstack()
在python中,有没有可能得到我在excel中得到的村庄名称?在
您可以使用:
sum
和^{transform
,带有{您可以尝试使用自定义函数进行调试:
^{pr2}$相关问题 更多 >
编程相关推荐