在spark python中,如何在一列中连接两个字符串列

2024-09-25 10:28:27 发布

您现在位置:Python中文网/ 问答频道 /正文

我想将dataframe中的两列连接为一列,这里我想将nameFirst和nameLast合并为名为FULL Name的列

+---------+---------+--------+
| playerID|nameFirst|nameLast|
+---------+---------+--------+
|aardsda01|    David| Aardsma|
|aaronha01|     Hank|   Aaron|
|aaronto01|   Tommie|   Aaron|
| aasedo01|      Don|    Aase|
+---------+---------+--------+

我正在尝试这个代码:

sqlContext.sql("SELECT playerID,(nameFirst+nameLast) as full_name FROM Master")

但它又回来了

+---------+---------+
| playerID|full_name|
+---------+---------+
|aardsda01|     null|
|aaronha01|     null|
|aaronto01|     null|
| aasedo01|     null|

有什么需要帮忙的吗


Tags: namedataframenullfulldavidaaronplayeridnamefirst