从pysp中dataframe中的元组中提取项

2024-05-19 22:26:13 发布

您现在位置:Python中文网/ 问答频道 /正文

我只是pyspark和数据帧的初学者 我的dtaframe是df([('one',1),('two',2),('three',3)],[('four',4)]) 所以我想把x连接到元组中的第一个元素。 例如onex, twox,threex,fourx。 感谢任何帮助。 df.select()只给出第一个列表中的项。 mk公司


Tags: 数据元素dfonepysparkthree元组four
1条回答
网友
1楼 · 发布于 2024-05-19 22:26:13
from pyspark.sql.functions import udf, col
from pyspark.sql.types import StringType

def append_x(val):
    return val + 'x'

df = df.withColumn(
    'appended',
    udf(append_x, StringType())(col(colInput))
)

请注意,colInput是要将x追加到的列的名称。在

相关问题 更多 >