当我这样做的时候
df: DataFrame = ...
df.write.parquet('some://location/')
我可以跟踪并报告(用于监视)刚刚写入some://location
的行数吗
df.write.parquet('some://location/')
# I imagine something like:
spark_session.someWeirdApi().mostRecentOperation().number_of_rows_written
Tags:
在做了一些挖掘之后,我找到了一种方法:
@DeveloperApi
)这是受cloudera社区中的一个post的启发,我不得不将它移植到更新的spark版本(使用spark 3.0.1,那里建议的答案使用不推荐的
SQLContext
)和pyspark(使用py4j回调)相关问题 更多 >
编程相关推荐