如何按列值的切片筛选数据帧

2024-09-29 21:58:05 发布

您现在位置:Python中文网/ 问答频道 /正文

假设我有以下数据帧:

    ter_id          shstr   value
6   2018002000000   201     1740.0
7   2018002000000   201     10759.0
8   2018002000002   201     2.0

如何筛选出最后六个符号为ter_id为零的行?也就是说,期望的输出是:

    ter_id          shstr   value
8   2018002000002   201     2.0

我做了一个布尔函数

def is_total(ter_id: str) -> bool:
    if ter_id[:-6] == "000000":
        return True
    return False

但it使用失败并出现错误:

dataset.filter(is_total(dataset.ter_id))
...
ValueError: The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any() or a.all().

熊猫版是1.0.1


Tags: 数据函数idreturnifisvaluedef
3条回答

对于基于列值过滤数据帧,很少有理由编写自己的函数。您可以将条件作为布尔掩码传递到df.loc[](假设您的数据帧名为df)

df = df.loc[df["ter_id"].str[-6:] != "000000"]

通过[-6:]更改最后6值的索引,并通过^{}获取所有不匹配的行:

df = dataset[dataset.ter_id.str[-6:] != "000000"]
print (df)
          ter_id shstr value
8  2018002000002   201   2.0

IIUC

df[~(df.ter_id%1000000==0)]
Out[256]: 
          ter_id  shstr  value
8  2018002000002    201    2.0

相关问题 更多 >

    热门问题