具有列的最小唯一值的行的随机值

Code Regione CodeProv Origin Name 0 1 Piemonte 1 Torino 1 1 Piemonte 2 Vercelli 2 1 Piemonte 2 Vercelli

2条回答

网友

1楼 · 编辑于 2024-09-29 02:28:50

如果您的姓名数量为>&燃气轮机；20并且您的姓名分布不会集中在不到20个姓名的范围内，那么不要使其过于复杂，只需这样做：

number_of_unique_names_in_sample = 0
while number_of_unique_names_in_sample < 20:
    df_sample = df.sample(n=10_000)
    number_of_unique_names_in_sample = df_sample["Name"].nunique()

并且可能添加一个计数器来限制迭代次数，以防您的分布发生变化（例如在一个小测试样本中）

网友

2楼 · 编辑于 2024-09-29 02:28:50

这可能是你的要求

name_cols = [list_of_names]
samples_per_name = 500

df[df['Name'].isin(name_cols)].groupby('Name').apply(lambda x: x.sample(samples_per_name))

结果将是10000行len(name_cols)（在您的示例中为20行），每行包含500行

编程相关推荐

无生物特征对话框的java Android生物特征认证
Java（Linux）和Windows系统之间的socket字符编码
java在Spring引导应用程序中使用JSF
java在没有类型转换的情况下访问父类型的arraylist中的特定子类型方法，子类型的创建只有在运行时才知道
java死锁线程检查
java Spring引导MySQL不批处理插入
java如何在Android文本视图中显示来自Firebase的消息列表？
Android API 24<与java一起崩溃。lang.NoClassDefFoundError:com。谷歌。常见的基础CharMatcher
如何在Java中修改JSON对象内的值
java解析JAR run命令中所需的参数

相关问题更多 >

编程相关推荐

热门问题

热门文章

具有列的最小唯一值的行的随机值

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >