在das中设置拼花地板输出文件的大小

1条回答

网友

1楼 · 发布于 2024-09-29 19:23:07

当前的行为是按设计的，允许每个工作进程独立地处理一个分区，并写入其他进程没有写入的文件。否则，在为每个目录写入数据后，需要某种类型的锁，或某种合并步骤。在

您可以做的是使用set_index将数据洗牌到一个分区中，该分区对应于要分区的列的每个值（可能使用divisions=关键字）；现在，to_parquet将为这些值中的每个值生成一个文件。如果您希望文件自动结束在正确的目录中，并修剪现在冗余的索引，那么您应该使用to_delayed()并创建一个延迟函数，该函数接受一个分区（pandas dataframe）并将其写入正确的位置。在

编程相关推荐

java如何设置apache camel groovy脚本组件的属性
java理解如何在if语句条件内创建对象
java使用访问者和复合模式构建过滤流
游戏框架上的java生成管理区（CRUD）
是java中的toString（）方法。util。日期与地区无关？
java是否可以扩展AppIUMFieldCorator类以使其接受自定义注释？
内存管理java jvm最大和最小堆选项
JavaSpringMVC：正确的异常处理
java保存拖放图像按钮的位置
java如何使用replaceAll（）替换算术（即0+1）

相关问题更多 >

编程相关推荐

热门问题

热门文章

在das中设置拼花地板输出文件的大小

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >