连接dask和vaex之间的进出口

1条回答

网友

1楼 · 发布于 2024-04-20 11:32:48

为了使用vaex打开parquet，您应该使用vaex.open，并且文件的扩展名必须是parquet

生成数据

fldr = "test"
os.makedirs(fldr, exist_ok=True)

n = 1_000
for i in range(10):
    fn = f"{fldr}/file{i}.parquet"
    df = pd.DataFrame(np.random.randn(n, 2), columns=["a", "b"])
    df["key"] = np.random.randint(0, high=100, size=n)
    df.to_parquet(fn, index=False)

示例：使用dask进行聚合和保存

df = dd.read_parquet(fldr)
grp = df.groupby("key").sum()
grp.to_parquet("output")

用vaex阅读

df = vaex.open("output/part.0.parquet")

编程相关推荐

java RestTemplate到elasticsearch 6.7.0搜索>错误请求
java如何在OpenGL中对半透明三角形排序？
java如何将Pentaho6.0连接到HadoopHive
java更改图像视图大小
SQL查询在TOAD中运行良好，但在java代码中则不行
java需要根据事件发送HTTP请求
java HTMLUnit在javascript异常上挂起/无限循环
java阵列访问如何影响性能？
使用回滚时不引发异常的java事务测试方法
java如何在最近屏幕后返回到上一个活动

生成数据

示例：使用dask进行聚合和保存

用vaex阅读

相关问题更多 >

编程相关推荐

热门问题

热门文章

连接dask和vaex之间的进出口

生成数据

示例：使用dask进行聚合和保存

用vaex阅读

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >