我一共有2个数据集,其中dataset1有大约40个条目的PATIENTID列,另一个dataset2有大约700个条目的PATIENTID列
我想检查dataset1的PATIENTID是否存在于dataset2中。你知道吗
我在pythonjupyter笔记本中尝试过,但它不能通过Python代码工作。你知道吗
PatientsNotTreated=unique(Datase1.PatientID)[!unique(Dataset1.PatientID) in unique(Dataset2.PatientID)]
PatientsNotTreated
我得到错误:
PatientsNotTreated=unique(Datase1.PatientID)[!unique(Dataset1.PatientID) in unique(Dataset2.PatientID)]
^
SyntaxError: invalid syntax
我期望patientID的输出在daTASET2中不存在
使用Series.isin与DataFrame.loc生成boolena indexing。最后使用Series.unique:
要根据患者用途筛选数据集1:
相关问题 更多 >
编程相关推荐