pandas数据帧的示例行与列中的计数成比例

2024-05-13 17:00:02 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个大约10000000行的大熊猫数据框。每一个代表一个特征向量。特征向量以自然组的形式出现,组标签位于名为group_id的列中。我想随机抽取10%行,但要与每个group_id行的数目成比例。

例如,如果group_id'sA, B, A, C, A, B,那么我希望一半的采样行有group_idA,六分之二有group_idB,六分之一有group_idC

我可以看到pandas函数sample,但我不确定如何使用它来实现这个目标。


Tags: 数据函数idpandasgroup代表标签形式