我正在使用python和pyspark来扩展SPSS建模器。在
我想操作~5000列,因此使用以下构造:
for target in targets:
inputData = inputData.withColumn(target+appendString, function(target))
这很慢。有没有一种更有效的方法来对所有目标列执行此操作?在
targets
包含要使用的列名列表,function(target)
是一个占位符,在这里我可以对不同的列进行加法和除法等操作。在
如果你能帮我,我会很高兴的:)
潘达约
Tags:
试试这个:
相关问题 更多 >
编程相关推荐