排除PySpark中包含字符串值的行

2024-06-26 04:42:48 发布

男 | 程序猿一只，喜欢编程写python代码。

我有一个PySpark数据框，看起来像这样：

+----+------+-----+
|name|amount| item|
+----+------+-----+
| Bob|  5.62|juice|
| Sue|  0.85| milk|
| Joe|  1.04| eggs|
+----+------+-----+

我想删除item列中的值包含milk或eggs.的行。以下是我得到的：

df = df.filter(~df.item.isin(['milk','eggs'])

但是，这不起作用——当我查看df.show（）时，有问题的行仍然存在

Tags：数据 name df show filter item amount eggs

0条回答

目前没有回答