从数据流中进行有或无权重的储层取样

weightreservoir的Python项目详细描述


这个模块带来了有效的储层取样方法,有无 体重。当你有一个非常大和未知的 大小为n的数据集,您希望对这些n个样本中的k个子集进行采样, 一个流或一个文件读取。

如果不存在重量,则每个样本将有同等的机会被选择 在最终子集中;如果使用权重,则每个样本将根据 为了他们的体重。

要安装
pip安装重量贮存器
用作python中的模块
来自权重库导入库
使用均匀采样

均匀=储液罐。均匀取样(尺寸=10)

#向流中添加一个项并决定是否对其进行采样 统一.addOne(itemValue)

#将项目列表添加到流中,并决定是否对每个项目进行采样 uniform.addAll(项目值列表)

#获取采样数据集的所有当前项,作为列表返回 uniform.get()

使用加权采样

重量样本=储罐。重量样本(尺寸=10)

#向流中添加一项并决定是否按其重量取样 weight_sample.addone(项值,项权重)

#将项目列表添加到流中并决定是否按其权重对每个项目进行采样 weight_sample.addall(项目值列表,项目权重列表)

#获取采样数据集的所有当前项,作为列表返回 重量样本。获取()

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
apache HttpClient execute(HttpUriRequest请求)和execute(HttpHost目标,HttpRequest请求)之间的java差异   如何向java进程传递多个密码   java servlet从外部事件调用网页中的javascript弹出/模式对话框   正在重置Unix Java路径变量   java将@Named managed bean注入另一个重用JSF页面?   java Cookie未显示在请求中   java如何记录用户的操作并在用户返回时重播?   java FTPSClient抛出异常javax。网ssl。SSLHandshakeException:握手期间远程主机关闭连接   java“变量可能尚未初始化”在何处使用开关盒进行初始化?   初始化Double java数组   java Android:如何通过按钮启动活动?   java设置外观和感觉颜色   计算两个时间戳对象之间的时间差的日期   扩展画布的类时,绘制方法出现java错误   java在不同的线程中运行JNI方法   java Spring引导OIDC刷新令牌场景   Java slf4j实现:logback vs log4j   java KeyEvents新的KeyEvent变量?   为什么java的模式和匹配器类中没有公共构造函数?   java在JVM上禁用本地JMX连接