数据帧中的标准随机样本
srs的Python项目详细描述
<;html>;<;h3>;srs(标准随机样本)<;h3>; 分层随机抽样是一种概率抽样,研究机构可以将整个群体分成多个不重叠、同质的群体(阶层),从各个阶层中随机选择最终成员进行研究,降低了成本,提高了效率。
让我们来考虑这样一种情况:一个研究小组正在不同年龄组之间就宗教问题征求意见。不必从326044985名美国公民那里收集反馈,可以随机抽取约10000个样本进行研究。这10000名公民按年龄可分为18-29岁、30-39岁、40-49岁、50-59岁和60岁及以上的群体。
在这种方法中,每个阶层的样本量与整个阶层的人口量成正比。这意味着每个地层样品都有相同的取样分数。
比例分层随机抽样公式:nh=(nh/n)*n NH=HTH地层的样本量 NH=高温高压层的人口规模 n=整个人口的规模 n=整个样本的大小
<;li>;参数<;li>; <;i>;样本大小(DSN、Stratas)<;/i>; dsn:人口数据集<;br>; stratas:列名为列表格式,例如:['strata1','strata2','strata3….']<;br>; 样本大小:作为一个样本,您需要多少百分比,如0.05、0.10、0.25…<;/br>; <;li>;示例用法<;li>; sample=srs.samp(df,'female',0.25)<;br>;<;html>;