我有25个变量DXCODE1到DXCODE25,我想扫描一下,看看每一行的这些值是否与icd\u列表匹配。例如,在每一行中,我要扫描从DXCODE1到DXCODE25的数据,看看这些数据是否包含以下三个值中的任何一个:“F32”、“F33”、“F34”,如果包含,则返回1。我尝试了以下方法:
def scan_icd (row):
icd_list = ['F32', 'F33', 'F34']
for i in range(1, 26):
dx_code_loc = 'DXCODE' + str(i)
for j in range(0, len(icd_list)):
if icd_list[j] in row[dx_code_loc]:
return 1
df['ICD_DX'] = df.apply(scan_icd, axis=1)
但我有个错误:
TypeError: ("argument of type 'float' is not iterable", 'occurred at index 1')
另外,我想使它灵活,以便我可以以某种方式指定icd代码作为参数中的列表。但我不知道如何应用语法:
def scan_icd (row, icd_list):
icd_list = icd_list
for i in range(1, 26):
dx_code_loc = 'DXCODE' + str(i)
for j in range(0, len(icd_list)):
if icd_list[j] in row[dx_code_loc]:
return 1
df['ICD_DX'] = df.apply(scan_icd (['F32', 'F33', 'F34']), axis=1)
TypeError: apply() got multiple values for argument 'axis'
======================
编辑:
列标记为DXCODE1、DXCODE2、。。。DXCODE25型
我想这个
apply
能胜任你想要的工作检查
icd_list
的任何元素是否在row
中编辑:如果您想保留for循环(很抱歉,一开始我没有看到这个要求),我会:
编辑2:要指定列,可以执行以下操作:
相关问题 更多 >
编程相关推荐