Apache Beam I/O转换

1条回答

网友

1楼 · 发布于 2024-10-04 11:22:48

下面是管道https://github.com/apache/beam/blob/fc738ab9ac7fdbc8ac561e580b1a557b919437d0/sdks/python/apache_beam/examples/wordcount.py#L37的示例

在您的示例中，首先获取文件名，然后逐个读取每个文件并写入输出。您可能还希望将文件名推送到groupby以使用运行程序提供的并行化。所以总的来说，你的管道看起来像读取文件名列表->；使用GroupBy键将文件名发送到Shuffle->；在pardo中一次获取一个文件名->；在pardo中读取单个文件、处理和写入

编程相关推荐

java Android/OkHttp获取源代码
java如何清理jComboBox中的空白
java Dagger 2和改型2更改基本URL
java while（1）使用continue和break语句循环
java如何在JGroup中禁用FIFO和重新传输协议？
java Log4j 2 JSON模式布局+记录JSON负载
google应用程序引擎Firebase Java管理SDK错误
如果我已经编写了显示目录的代码，我将如何制作它，以便java能够说明这个结果是一个文件，还是另一个目录/文件夹？
java Twilio:Twilio。装置connect（）未命中语音请求URL
在Java中加载带有JRI的R库时写入内核转储失败

相关问题更多 >

编程相关推荐

热门问题

热门文章

Apache Beam I/O转换

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >