我有一个PySpark数据框,看起来像这样:
+----+------+-----+
|name|amount| item|
+----+------+-----+
| Bob| 5.62|juice|
| Sue| 0.85| milk|
| Joe| 1.04| eggs|
+----+------+-----+
我想删除item
列中的值包含milk
或eggs.
的行。以下是我得到的:
df = df.filter(~df.item.isin(['milk','eggs'])
但是,这不起作用——当我查看df.show()时,有问题的行仍然存在
目前没有回答
相关问题 更多 >
编程相关推荐