如何从具有频率的数据帧中提取随机样本？

1条回答

网友

1楼 · 发布于 2024-09-28 21:20:44

您可以获取数据帧的index：

>>> colors = df.sample(10, replace=True, weights='balls').index
>>> colors
Index(['red', 'red', 'red', 'blue', 'red', 'red', 'red', 'red', 'blue',
       'green'],
      dtype='object')
>>> list(colors)
['red', 'red', 'red', 'blue', 'red', 'red', 'red', 'red', 'blue', 'green']

编辑：如注释中所述，这并不保证对球数的限制

为了保证这一点，您需要创建一个包含所有值的数据帧，然后对其调用sample(n)

>>> n_red, n_blue, n_green = (10, 1, 5)
>>> data = ['red'] * n_red + ['blue'] * n_blue + ['green'] * n_green
>>> df = pd.DataFrame(data, columns=['balls'])
>>> list(df.sample(10)['balls'])
['red', 'green', 'red', 'green', 'green', 'red', 'green', 'red', 'red', 'blue']

请注意，您不能再对样本进行加权，因为它们已按构造进行加权（颜色的行数越多，拾取该颜色的可能性就越大）

编程相关推荐

http POST请求Java CouchDB
java删除带有大量尾随0的浮点字符串上的科学符号
JavaEE5和Hibernate
java如何在Spring Social中获得比特定id更早的tweet
java是框架。revalidate（）在事件后获取输出是否重要？
java为什么不能返回通用映射？
java如何理解和优化工厂方法的高自时间
java Eclipse 202006错误由于项目的生成路径不完整，因此未生成该项目
多线程是java。util。向量序列化线程安全？
在Eclipse和java中使用不同的构建配置。属性文件

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何从具有频率的数据帧中提取随机样本？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >