Python中具有非等连接的Countifs

Table Name -T1 User Id Start time End time Count A1 10-01-2018 10:15 10-01-2018 12:15 0 A2 10-01-2018 10:45 10-01-2018 11:15 0 A1 10-01-2018 10:25 10-01-2018 13:30 1 A2 10-01-2018 11:00 10-01-2018 11:40 1

1条回答

网友

1楼 · 发布于 2024-09-26 22:53:13

您可以使用pandas实现这一点

import pandas as pd

fmt = '%m-%d-%Y %H:%M'
columns = ['Users', 'Start Time', 'End Time', 'Count']

df = pd.read_excel('filename.xlsx', sheetname="Sheet1")
df.columns=columns

#get the start dates less than the first
df1=df[df['Start Time']<df.iloc[0]['Start Time']]
#get the end dates less than the first
df2=df[df['End Time']<df.iloc[0]['End Time']]

#find matching rows between df1 and df2
df3 = pd.merge(df1, df2, on=columns, how='inner')
print(df3)

我在下面的数据上运行了这个

A1   10-01-2018 10:15   10-01-2018 12:15   0
A2   10-01-2018 10:45   10-01-2018 11:15   0 
A3   10-01-2018 10:25   10-01-2018 13:30   1
A4   10-01-2018 11:00   10-01-2018 11:40   1
A5   10-01-2018 10:00   10-01-2018 11:15   0

这张照片：

  Users        Start Time          End Time  Count
0    A5  10-01-2018 10:00  10-01-2018 11:15      0

如果您想在python dict中重新使用它，只需使用：

df3.set_index('Users').T.to_dict('dict')
#{'A5': {'Start Time': '10-01-2018 10:00', 'End Time': '10-01-2018 11:15','Count': 0}}

编辑

我的电脑上没有excel，而且我很难破译excel公式。如果上面的代码除了对用户进行约束之外，还做了您想做的事情，那么就把它放在我定义df1和df2的地方。这限制了特定用户。你知道吗

df = df[df.Users == 'A1']

然后要获得这些过滤器之后的所有过滤器的计数：

df3.shape()[0]

相关问题更多 >

编程相关推荐

热门问题

热门文章

Python中具有非等连接的Countifs

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >