从数据框架中有效地提取数据子集

for i in range(len(Patients)): ind_id = Patients.ID.iloc[i] ind_test1 = Test1[Test1['ID'] == ind_id] ind_test2 = Test2[Test2['ID'] == ind_id] ind_test3 = Test3[Test3['ID'] == ind_id] ind_test4 = Test4[Test4['ID'] == ind_id] ind_test3 = Test5[Test5['ID'] == ind_id]

Patients_v = Patients.values Test1_v = Test1.values Test2_v = Test2.values Test3_v = Test3.values Test4_v = Test4.values Test5_v = Test5.values for i in range(len(Patients_v)): ind_id = Patients_v[i, ID_idx] ind_test1 = Test1_v[Test1_v[:, 0] == ind_id] ind_test2 = Test2_v[Test2_v[:, 0] == ind_id] ind_test3 = Test3_v[Test3_v[:, 0] == ind_id] ind_test4 = Test4_v[Test4_v[:, 0] == ind_id] ind_test5 = Test5_v[Test5_v[:, 0] == ind_id]

1条回答

网友

1楼 · 发布于 2024-09-29 01:36:07

目前还不清楚你想要什么样的产出。我们只能假设您需要特定于患者的数据帧。你知道吗

在任何情况下，当前代码都必须在内存中保存所有数据帧。这是低效的。例如，看看generator functions：

<强>1。创建所有ID的列表

ALL_IDS = Patients.IDs.tolist()                        # Assuming all you need is the ID

<强>2。创建主数据帧

ALL_DFS = [Test1, Test2, Test3, Test4, Test5]
df_master = pd.concat(ALL_DFS)

3岁。创建生成器函数，生成特定于患者的数据帧以供进一步处理

def patient_slices(ALL_IDS):                           # Generator
    for ID in ALL_IDS:
        df_slice = df_master[df_master.ID == ID]
        yield df_slice

df_slice = patient_slices(ALL_IDS)                      
for _ in xrange(len(ALL_IDS)):                         # Call the generator n times
    sinlge_patient = next(df_slice)                    # Next patient for every call    
    your_processing(sinlge_patient)                    # Do your magic

相关问题更多 >

编程相关推荐

热门问题

热门文章