为什么PySpark任务花费了太多时间?我正在运行一个Pyspark进程,它可以正常工作。该过程的第一步是将特定的UDF应用于数据帧。这就是功能: import html2text class Udfs(object): def ...2024-10-04 已阅读: n次