2024-05-19 22:26:13 发布
网友
我只是pyspark和数据帧的初学者 我的dtaframe是df([('one',1),('two',2),('three',3)],[('four',4)]) 所以我想把x连接到元组中的第一个元素。 例如onex, twox,threex,fourx。 感谢任何帮助。 df.select()只给出第一个列表中的项。 mk公司
df([('one',1),('two',2),('three',3)],[('four',4)])
onex, twox,threex,fourx
df.select()
from pyspark.sql.functions import udf, col from pyspark.sql.types import StringType def append_x(val): return val + 'x' df = df.withColumn( 'appended', udf(append_x, StringType())(col(colInput)) )
请注意,colInput是要将x追加到的列的名称。在
colInput
x
请注意,
colInput
是要将x
追加到的列的名称。在相关问题 更多 >
编程相关推荐