基于未知数量的列和值构造布尔掩码

1条回答

网友

1楼 · 发布于 2024-05-19 11:02:47

因为可以将字符串传递给df.query()，所以只要可以将输入格式转换为字符串，就很容易找到所需的子集。我为您的输入格式编写的解析器并不是非常优雅，但希望您能理解：

import pandas as pd
import numpy as np

maskA_str = "maskA - a: 4, 8 - b: 1, 5 - c: 1"
df = pd.DataFrame(
    {'a': np.random.randint(1, 10, 100),
     'b': np.random.randint(1, 10, 100),
     'c': np.random.randint(1, 10, 100)}
)

def create_query_str(mask_str):
    mask_name, column_conds = mask_str.split('-')[0], mask_str.split('-')[1:]
    query_str = '('
    column_strs =[]
    for cond in column_conds:
        cond_str = '('
        column, vals = cond.split(':')
        column = column.strip()
        test_strs = ['{c} == {v}'.format(c=column, v=val.strip())
                     for val in vals.split(',')]
        cond_str += ' | '.join(test_strs)
        cond_str += ')'
        column_strs.append(cond_str)
    query_str += ' & '.join(column_strs)
    query_str += ')'
    return query_str

create_query_str(maskA_str)
Out[17]: '((a == 4 | a == 8) & (b == 1 | b == 5) & (c == 1))'

# Can now be used directly in df.query()
df.query(create_query_str(maskA_str))

相关问题更多 >

编程相关推荐

热门问题

热门文章

基于未知数量的列和值构造布尔掩码

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >