优化比较数据帧的函数

event_date raw_data1 session_id ws_id 0 2017-11-06 12:13:06 {'description': 'Home'} 0604e80d-1ae6-48d0-81bf-32ca1dc58e4c machine2 1 2017-11-06 12:13:41 {'description': 'AreYouStillThere'} 0604e80d-1ae6-48d0-81bf-32ca1dc58e4c machine2 2 2017-11-06 12:14:09 {'description': 'AttractiveAnimation'} 0604e80d-1ae6-48d0-81bf-32ca1dc58e4c machine2 3 2017-11-07 10:06:15 {'description': 'Home'} e2e7565f-60b4-4e7b-a8f0-d0a9c384b283 machine13 4 2017-11-07 10:06:27 {'description': 'AuthenticationPanelAdmin'} e2e7565f-60b4-4e7b-a8f0-d0a9c384b283 machine13

dtrange start end status machine_id 0 DateTimeTZRange(datetime.datetime(2017, 11, 17... 2017-11-17 14:46:15 2017-11-17 15:01:15 2 12 1 DateTimeTZRange(datetime.datetime(2017, 11, 17... 2017-11-17 14:47:02 2017-11-17 15:02:02 2 22 2 DateTimeTZRange(datetime.datetime(2017, 11, 17... 2017-11-17 14:47:23 2017-11-17 15:02:23 2 18 3 DateTimeTZRange(datetime.datetime(2017, 11, 17... 2017-11-17 14:48:09 2017-11-17 15:03:09 2 17 4 DateTimeTZRange(datetime.datetime(2017, 11, 17... 2017-11-17 14:49:18 2017-11-17 15:04:18 2 15

def CheckSession(machinename, sessiontime, sessionid): if len(offlinedf[(offlinedf.start<sessiontime) &(offlinedf.end>sessiontime) &(offlinedf.name==machinename)])>0: return sessionid sessions = df.apply(lambda row: CheckSession(row["name"], row["created_at1"], row["session_id"]), axis=1)

1条回答

网友

1楼 · 发布于 2024-06-26 00:13:10

考虑mergingdf和offlinedfbyname，然后根据函数内部的逻辑使用^{}进行过滤。然后将过滤后的数据帧的sessionid列转换为一个列表

session_df = df.merge(offlinedf, on='name', suffixes=['', '_'])\
               .query('start < created_at1 & end > created_at1') 

sessions = session_df['sessionid'].tolist()

在任何数据分析工作中，对象的分块处理都比迭代行处理好

相关问题更多 >

编程相关推荐

热门问题

热门文章