基于数据帧中的位置计算元素

+-------+----------+----------+----------+--------+----------+ | Group | TST1 | TST2 | TST3 | TST4 | TST5 | +-------+----------+----------+----------+--------+----------+ | A | | NOT_DONE | | | 50 | +-------+----------+----------+----------+--------+----------+ | A | | | 35 | | | +-------+----------+----------+----------+--------+----------+ | B | | | | | | +-------+----------+----------+----------+--------+----------+ | A | | | INCOMP | | | +-------+----------+----------+----------+--------+----------+ | B | UNTESTED | | 50 | INCOMP | | +-------+----------+----------+----------+--------+----------+ | B | | | | | | +-------+----------+----------+----------+--------+----------+ | B | | 30 | | | | +-------+----------+----------+----------+--------+----------+ | A | | INCOMP | 40 | | | +-------+----------+----------+----------+--------+----------+ | B | | | | | UNTESTED | +-------+----------+----------+----------+--------+----------+ | A | | | | | | +-------+----------+----------+----------+--------+----------+ | B | | INCOMP | | | | +-------+----------+----------+----------+--------+----------+ | A | | | | | | +-------+----------+----------+----------+--------+----------+ | B | | 50 | | | | +-------+----------+----------+----------+--------+----------+ | B | | | UNTESTED | 35 | NOT_DONE | +-------+----------+----------+----------+--------+----------+ | B | | | | | | +-------+----------+----------+----------+--------+----------+ | A | | 40 | | INCOMP | | +-------+----------+----------+----------+--------+----------+ | A | | | | 30 | | +-------+----------+----------+----------+--------+----------+ | B | | | | | | +-------+----------+----------+----------+--------+----------+ | B | | NOT_DONE | | 30 | NOT_DONE | +-------+----------+----------+----------+--------+----------+

filter1 = df.loc[:, 'TST1':'TST5']\ .apply(lambda x: x.astype(str).str.match(r'\d+\.*\d*'), axis=0)\ .any(axis=1) number_validated = filter1.sum() print "Number of validated items: ", number_validated

1条回答

网友

1楼 · 发布于 2024-09-24 22:32:34

另一个选项，在python 2.7.18和pandas 0.24.2上测试（尽管在python 3中工作良好）：

使用^{}提取最右边的值，并使用^{}强制将其转换为数字：

rightmost = df.filter(like='TST').ffill(axis='columns').iloc[:, -1]
rightmost = pd.to_numeric(rightmost, errors='coerce')

# 0      NaN
# 1     35.0
# 2      NaN
# 3      NaN
# 4      NaN
# 5      NaN
# 6     30.0
# 7     40.0
# 8      NaN
# 9      NaN
# 10     NaN
# 11     NaN
# 12    50.0
# 13     NaN
# 14     NaN
# 15     NaN
# 16    30.0
# 17     NaN
# 18     NaN
# Name: TST5, dtype: float64

然后^{}检查Group是否为^{}30和50（包括）：

valid = rightmost.groupby(df.Group).apply(
    lambda g: g.between(30, 50, inclusive='both').sum()
).to_frame('Valid')

#        Valid
# Group       
# A          3
# B          2

相关问题更多 >

编程相关推荐

热门问题

热门文章