超大数据帧中带掩码的高效条件选择

dt num 0 2019-05-12 10:17:00 135 1 2018-01-16 21:32:00 5 2 2017-11-30 22:29:00 135 3 2017-10-05 16:59:00 19 4 2017-08-07 05:26:00 5 5 2017-06-12 17:47:00 18

2条回答

网友

1楼 · 编辑于 2024-06-26 14:08:32

@It_is_Chris完全正确，如果您有更多可用的内核，请使用groupby应用技巧并行执行此任务

from multiprocessing import Pool, cpu_count

def applyParallel(dfGrouped, func):
    with Pool(cpu_count()) as p:
        ret_list = p.map(func, [group for name, group in dfGrouped])
    return pandas.concat(ret_list)

因此，将df.groupby（df['num']）作为dfGrouped传入，然后根据需要定义函数

网友

2楼 · 编辑于 2024-06-26 14:08:32

mins = df.groupby("num")["dt"].min()
print(mins)

输出：

编程相关推荐

java如何从用户输入中找到最大值和最小值？（while循环）
java数据库资源异常
java hibernate查询速度太慢，是否忽略了延迟加载条件？
不带花括号的java IfElse控制流
nextInt（）中十进制数输入的java检查
java根据REST中的资源类型发送不同的响应主体
JAVAutil。扫描器Java系统。争论中
对于单个条目，java XSLT到数组的转换失败
java将txt文档预处理为以字符串为键、整数ArrayList为值的hashmap
java获取泛型数组类类型的简单方法？

相关问题更多 >

编程相关推荐

热门问题

热门文章

超大数据帧中带掩码的高效条件选择

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >