以tuple为值的Spark Streaming updateStateByKey是否可以将updateStateByKey()函数与元组一起用作值?我使用的是PySpark,我的输入是(word, (count, tweet_id)),这意味着word是一个键,一个元组{}是一个 ...2024-10-01 已阅读: n次
在pysp中保存批数据我需要从批处理中积累一段时间的数据,以便进行后期处理。我使用的是Spark 1.6.3。 我需要以(tag, [[time, value],..]的形式累积它们。 到目前为止,我已经尝试了update ...2024-10-01 已阅读: n次