如何比较和导出多个csv文件的唯一值

employee_number email System 807 marg.prent@test.com System1 8304 bill.riley@test.com System1 10441 doug.wever@test.com System1 12374 Rich.flipt@test.com System2 14012 doug.wever@test.com System2 15906 marg.prent@test.com System2 16223 mark.johns@test.com System3 82189 doug.wever@test.com System3 86099 krish.ragg@test.com System3 86646 marg.prent@test.com System4 87165 doug.wever@test.com System4 87844 jose.taver@test.com System4 88165 doug.wever@test.com System5 87944 jared.Rich@test.com System5 87944 John.taver@test.com System5

`import pandas as pd from pandas import ExcelWriter from pandas import ExcelFile df = pd.read_excel('file.xlsx') EmailSysList = df[['email','System']] for x in EmailSysList['email']: if EmailSysList['System'] == "System 1 ":

2条回答

网友

1楼 · 编辑于 2024-09-24 22:30:29

groupby and count（）会提供所需的电子邮件，然后您可以使用该序列来拆分初始数据帧。你知道吗

morethan3emails = (df.groupby('email', as_index=False)
                     .System
                     .count()
                     .query('System > 3')
                     .email)

morethan3df = df[df.email.isin(morethan3emails)]
lessthan4df = df[~df.email.isin(morethan3emails)]

网友

2楼 · 编辑于 2024-09-24 22:30:29

所以这里可能有很多方法可以解决这个问题。我将使用^{}和^{}。你知道吗

让我们首先过滤数据帧，以获得在3个以上系统中的用户。既然你说不会有重复，我们可以简单地使用计数！你知道吗

more_than_3 = df1[df1.groupby('email')['email'].transform('count') > 3].sort_values(['email', 'System'])
# sort values is just making the output more readable and put everything in order.
# output below
    employee_number email   System
2   10441   doug.wever@test.com System1
4   14012   doug.wever@test.com System2
7   82189   doug.wever@test.com System3
10  87165   doug.wever@test.com System4
12  88165   doug.wever@test.com System5

然后我们简单地把其他人的逻辑颠倒过来：

others = df1[df1.groupby('email')['email'].transform('count') <= 3].sort_values(['email', 'System'])
# output
    employee_number email   System
14  87944   John.taver@test.com System5
3   12374   Rich.flipt@test.com System2
1   8304    bill.riley@test.com System1
13  87944   jared.Rich@test.com System5
11  87844   jose.taver@test.com System4
8   86099   krish.ragg@test.com System3
0   807     marg.prent@test.com System1
5   15906   marg.prent@test.com System2
9   86646   marg.prent@test.com System4
6   16223   mark.johns@test.com System3

要将这些数据帧发送到excel，可以使用^{}。此外，如果在同一工作簿中需要它们，请使用sheetname参数。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章