因此,我有一个数据帧,如:
+--------------------+--------------+------------+-----------+-----------+-----------+-----------+
| category |category_new | value | body | legs | face | idle |
+--------------------+--------------+------------+-----------+-----------+-----------+-----------+
| sn11 | sn11 | N | Y | Y | Y | acde |
| sn1 | rs1 | N | Y | N | N | den |
| sn1 | null | Y | N | Y | N | can |
| sn2 | rs2 | Y | Y | N | N | aeg |
| null | rs2 | N | Y | N | Y | ueg |
+--------------------+--------------+------------+-----------+-----------+-----------+-----------+
当body==legs
时,我想用face替换value
。因此,对于body
和legs
都是Y的第一行,我将用face
(Y)的值替换value
(N)的值
你知道怎么做吗
您可以使用来自
pyspark.sql.functions
的函数when
执行此操作:也许您可以尝试使用pandas.DataFrame.assign执行此操作:
相关问题 更多 >
编程相关推荐