- 当前热门话题:
Python sampleby
-
本站为您提供最新、最全的sampleby的Python教程、文档、代码、资源等相关内容,Python中文网技术交流社区同时还提供学习资源下载,
如:电子书、IDE编辑器软件、编程视频、代码规范标准、WEB开发、GUI、科学计算与人工智能等相关内容。
本文网址:https://cnpython.com/tags/696603
欢迎加入QQ群-->: 979659372
关于sampleby 相关联的Python项目和问题:
最新问答
我在PySpark2.4.0中有一个数据帧df,我想使用sampleBy获取它的一个示例。它包含一列category,我有一个dict作为样本:
dict = {
"cat_A" : 0.1,
"ca ...
已阅读: n次
我希望使用sampleBy获得基于列分布的样本。例如,在每个prod_name组中,我想基于colour列sampleBy("colour", fractions ={"blue":0.5, "yel ...
已阅读: n次
实际上,我正在处理一个大型数据集(87,56685),其中包括USERID、MOVIEID和RATING
我需要对评级使用抽样方法来减少数据集的大小,我仅限于使用抽样策略
我试过这种方法
DataFr ...
已阅读: n次
我想对PySpark上的数据帧进行分层抽样。有一个sampleBy(col, fractions, seed=None)函数,但它似乎只使用一个列作为层。有没有办法用多根柱子作为地层?在 ...
已阅读: n次
我有一个spark数据帧(我正在使用pyspark)“订单”。它有以下几列
['id', 'orderdate', 'customerid', 'status']
我正在尝试使用关键列作为“状态”进 ...
已阅读: n次
我想根据ID和它们所属的通信类型对以下数据集进行采样;同一个ID可以有多个comm_类型,数据集非常庞大,因此我想对100万个唯一ID的较小样本进行进一步分析;
我看到有一个sampleBy(col, ...
已阅读: n次
最新项目