排除PySpark中包含字符串值的行

2024-06-26 04:42:48 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个PySpark数据框,看起来像这样:

+----+------+-----+
|name|amount| item|
+----+------+-----+
| Bob|  5.62|juice|
| Sue|  0.85| milk|
| Joe|  1.04| eggs|
+----+------+-----+

我想删除item列中的值包含milkeggs.的行。以下是我得到的:

df = df.filter(~df.item.isin(['milk','eggs'])

但是,这不起作用——当我查看df.show()时,有问题的行仍然存在


Tags: 数据namedfshowfilteritemamounteggs