我有一个数据框,里面有关于电影的信息。它有一个名为genre
的列,其中包含它所属的流派列表。例如:
df['genre']
## returns
0 ['comedy', 'sci-fi']
1 ['action', 'romance', 'comedy']
2 ['documentary']
3 ['crime','horror']
...
我想知道如何查询数据帧,以便它返回属于cerain类型的电影?
例如,df['genre'].contains('comedy')
返回0或1。
我知道我可以做如下事情:
'comedy' in ['comedy', 'sci-fi']
然而,在pandas中,我没有找到类似的东西,我只知道df['genre'].str.contains()
,但它不适用于列表类型。
可以使用^{} 创建} :
mask
,然后使用^{根据source code,可以使用
.str.contains(..., regex=False)
。使用集合
以我更喜欢的方式呈现
效率更高
在两个过程中使用
str
慢点!也不完全准确!
相关问题 更多 >
编程相关推荐