Python中文
首页
教程
问答
标签
搜索
登录
注册
Google云数据流Java SDK与Python SDK
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我开始使用谷歌云数据流进行批处理和流处理。正在开发的作业主要用于从不同来源(MySQL、Kafka和文件系统)获取数据、清理数据、进行流式处理和bath聚合,以及写回Google云存储</p> <p>对于这些任务,有没有建议使用<strong>JavaSDK</strong>或<strong>Python SDK</strong>来编写作业?它们之间在性能和功能方面有什么明显的差异吗</p> <p>例如,我注意到对于JavaSDK,内置的I/O<code>PTransform</code><strong>JdbcIO</strong>是可用的。这个<code>PTransform</code>读取和写入JDBC上的数据,而这在Python SDK中是不可用的(到目前为止)。是否可以只使用Java SDK创建从MySQL数据库读取数据并写入Google云存储的管道,而其他管道使用不同的SDK(例如Python)</p> <p>提前感谢您的时间</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>我将继续使用<code>java</code>SDK,因为特性和外部连接器更多地使用java。但是<code>python</code>SDK也在迎头赶上</p> <p>当我们向数据流提交一个beam作业时,就性能考虑而言,作业步骤将在一个API调用中发送到googlecloud数据流。因此,就数据流而言,我认为在性能上没有显著差异</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
为什么在使用strptime时会出现未进行转换的数据错误?
3 回答
为什么在使用strptim时会出现这个datetime日期错误
1 回答
为什么在使用StyleFrame时索引列的标题不显示sf.至excel()?
1 回答
为什么在使用sum()函数时会发生“int”对象不可调用的错误?
2 回答
为什么在使用sympy.dsolve时会得到“'list'对象没有属性'func'”?
3 回答
为什么在使用tabla时会得到一个空的数据帧?
10 回答
为什么在使用tensorboard时需要add_graph()的第二个参数?
2 回答
为什么在使用TensorFlow Lite转换YOLOv4时,推断时间/大小没有改进?有什么可能的改进吗?
3 回答
为什么在使用Tensorflow加载训练批时会出现内存泄漏?
1 回答
为什么在使用tensorflow时会收到警告/错误(使用函数API,但未实现错误)
1 回答
为什么在使用tetpyclient发出POST请求时出现403错误?
7 回答
为什么在使用TextBlob时会出现HTTP错误?
3 回答
为什么在使用TFIDF时出现错误“IndexError:list index out of range”pyspark.ml.feature?
6 回答
为什么在使用timedelta格式化之后,我在python中的日期是错误的?
3 回答
为什么在使用timeit或exec函数时,函数中的变量不会在提供的全局命名空间中搜索?
9 回答
为什么在使用tkinter时不能使用复选框?
7 回答
为什么在使用todoistpythonapi时会返回这个奇怪的ID?
2 回答
为什么在使用TQM时,在调整图像大小时,处理时间会有很大的差异?
6 回答
为什么在使用Tweepy下载用户时间线时收到错误消息
8 回答
为什么在使用twitter帐户登录Django应用程序时重定向127.0.0.1:8000?
10 回答