返回pandas dataframe中的行,其中列中的元组包含某个值

2024-09-25 00:25:16 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图查询pandas数据帧中的行,其中一列包含一个包含特定值的元组。在

例如:

   User                 Col1
0     1     (cat, dog, goat)
1     1         (cat, sheep)
2     1        (sheep, goat)
3     2          (cat, lion)
4     2  (fish, goat, lemur)
5     3           (cat, dog)
6     4          (dog, goat)
7     4                  cat

所以假设我想返回Col1包含'cat'的行,有没有一种方法可以不迭代每一行并执行“if”(我的实际数据集有更多的行)?在

^{pr2}$

以及

df['Col1'].str.contains("cat")

只对最后一行返回'true'


Tags: 数据方法pandasifcatcol1元组dog
3条回答

数据帧列包含字符串和元组的混合。我不认为您可以避免迭代该列。但是可以使用apply方法高效地进行迭代。下面是示例代码。在

import pandas as pd

# fake data - in a Series for simplicity
tlist = [('cat', 'dog', 'goat'),
    ('cat', 'sheep'),
    ('sheep', 'goat'),
    ('cat', 'lion'),
    ('fish', 'goat', 'lemur'),
    ('cat', 'dog'),
    ('dog', 'goat'),
    'cat']
s = pd.Series(tlist)

# iterate Series with a lambda function searching for 'cat'
s.apply(lambda x: 'cat' in x)

这给了我以下的输出

^{pr2}$

为什么不将数据帧子集化,然后输出结果呢?在

catdf = df[df['Col1'].str.contains("cat")]

您可以在^{}中使用lambda函数:

df[df["Col1"].apply(lambda x: True if "cat" in x else False)]

"cat"在单元格中时,lambda返回True。它适用于字符串("cat" in "cat"True)和元组("cat" in ("cat", "dog")True)。通过对df进行子集设置,可以得到lambda是True的所有行。在

相关问题 更多 >