我在一个数据帧中有两列。第一列被命名为前一个代码,第二列被命名为新代码_代码。这些列的值为“PO”、“GO”、“RO”等。这些代码具有优先级,例如“PO”的优先级高于“GO”。我想比较这两列的值,并将新列中的输出设置为“High”,“Low”和“No Change”表示两列代码相同。下面是dataframe的示例
CustID|previous_code|New_code
345. | PO. | GO
367. | RO. | PO
385. |PO. | RO
455. |GO. |GO
预期输出数据帧
CustID|previous_code|New_code|Change
345. | PO. | GO. | Low
367. | RO. | PO. |High
385. |PO. | RO. |Low
455. |GO. |GO. |No Change
如果有人能写一个演示代码在pyspark或Pandasthat这将是有益的。你知道吗
提前谢谢。你知道吗
如果我正确理解了顺序,这应该可以正常工作:
输出:
相关问题 更多 >
编程相关推荐