擅长:python、mysql、java
<p>首先需要聚合各个数据帧。在</p>
<pre><code>from pyspark.sql import functions as F
df1 = df1.groupBy('EMP_CODE').agg(F.concat_ws(" ", F.collect_list(df1.COLUMN1)))
</code></pre>
<p>您必须为所有列和所有数据帧编写此代码。
然后必须对所有数据帧使用union函数。在</p>
^{pr2}$
<p>然后在那个联合数据帧上重复相同的聚合。在</p>