如何通过使用forloops扫描多个列来创建一个新的pandas列？

def scan_icd (row): icd_list = ['F32', 'F33', 'F34'] for i in range(1, 26): dx_code_loc = 'DXCODE' + str(i) for j in range(0, len(icd_list)): if icd_list[j] in row[dx_code_loc]: return 1 df['ICD_DX'] = df.apply(scan_icd, axis=1)

def scan_icd (row, icd_list): icd_list = icd_list for i in range(1, 26): dx_code_loc = 'DXCODE' + str(i) for j in range(0, len(icd_list)): if icd_list[j] in row[dx_code_loc]: return 1 df['ICD_DX'] = df.apply(scan_icd (['F32', 'F33', 'F34']), axis=1) TypeError: apply() got multiple values for argument 'axis'

1条回答

网友

1楼 · 发布于 2024-10-03 04:36:59

我想这个apply能胜任你想要的工作

icd_list = ['F32', 'F33', 'F34']
df['ICD_DX'] = df.apply(lambda row: 1 if row.isin(icd_list).any() else 0, axis=1)

检查icd_list的任何元素是否在row中

编辑：如果您想保留for循环（很抱歉，一开始我没有看到这个要求），我会：

def scan_icd (row, icd_list):
    for i in range(1, 26):
        dx_code_loc = 'DXCODE' + str(i)
        for j in range(0, len(icd_list)):
            if icd_list[j] in row[dx_code_loc]:
                return 1
    return 0 # return 0 if none match
icd_list = ['F32', 'F33', 'F34']
df['ICD_DX'] = df.apply(scan_icd, args=([icd_list]), axis=1) 
# note the list of the list icd_list in args

编辑2：要指定列，可以执行以下操作：

list_col = ['DXCODE' + str(i) for i in range(1,26)]
df['ICD_DX'] = df.apply(lambda row: 1 if row[list_col].isin(icd_list).any() else 0, axis=1)
# see the difference is with row[list_col]

相关问题更多 >

编程相关推荐

热门问题

热门文章