如何为spark中的多个数据帧生成相同的UUID?我有一个从文件中读取的df import uuid df = spark.read.csv(path, sep="|", header=True) 然后我给它一个UUID列 uuidUdf= ud ...2024-10-01 已阅读: n次
使用python进行Spark流式处理:如何添加UUID列?我想在我的数据帧中添加一个具有生成id的列。我试过: uuidUdf = udf(lambda x: str(uuid.uuid4()), StringType()) df = df.withColu ...2024-10-01 已阅读: n次