获取不在特定商店购物的客户列表

df = pd.DataFrame({'shop': pd.Series(['McDonalds', 'McDonalds', 'McDonalds', 'McDonalds', 'Burger King', 'Burger King', 'Burger King', 'Burger King', 'Burger King', 'Trump Golf Course', 'Trump Golf Course', 'Trump Golf Course', 'Trump Golf Course', 'Trump Golf Course', 'Trump Golf Course'],dtype='object',index=pd.RangeIndex(start=0, stop=15, step=1)), 'Customer': pd.Series(['John Ryan', 'Jim Bob', 'Mary Ryan', 'Michael Patric', 'John Ryan', 'Jim Bob', 'Mary Ryan', 'Sean Connery', 'Brad Pitt', 'John Ryan', 'John Ryan', 'Michael Patric', 'Mary Ryan', 'John Ryan', 'Jim Bob'],dtype='object',index=pd.RangeIndex(start=0, stop=15, step=1)), 'Customer ID': pd.Series([1, 2, 3, 4, 1, 2, 3, 5, 6, 1, 1, 4, 3, 1, 2],dtype='int64',index=pd.RangeIndex(start=0, stop=15, step=1)), 'Amount': pd.Series([50, 32, 15, 65, 32, 51, 54, 84, 52, 51, 2, 32, 54, 87, 65],dtype='int64',index=pd.RangeIndex(start=0, stop=15, step=1))}, index=pd.RangeIndex(start=0, stop=15, step=1)) print(df) shop Customer Customer ID Amount 0 McDonalds John Ryan 1 50 1 McDonalds Jim Bob 2 32 2 McDonalds Mary Ryan 3 15 3 McDonalds Michael Patric 4 65 4 Burger King John Ryan 1 32 5 Burger King Jim Bob 2 51 6 Burger King Mary Ryan 3 54 7 Burger King Sean Connery 5 84 8 Burger King Brad Pitt 6 52 9 Trump Golf Course John Ryan 1 51 10 Trump Golf Course John Ryan 1 2 11 Trump Golf Course Michael Patric 4 32 12 Trump Golf Course Mary Ryan 3 54 13 Trump Golf Course John Ryan 1 87 14 Trump Golf Course Jim Bob 2 65

TypeError: ufunc 'bitwise_and' not supported for the input types, and the inputs could not be safely coerced to any supported types according to the casting rule ''safe'' TypeError: cannot compare a dtyped [int64] array with a scalar of type [bool]

shop Customer Customer ID Amount No_McDonalds 7 Burger King Sean Connery 5 84 True 8 Burger King Brad Pitt 6 52 True

3条回答

网友

1楼 · 编辑于 2024-05-08 04:00:08

这应该做到：

aux = df.groupby('Customer').shop.sum()

df['No_McDonalds'] = df.Customer.map(aux.apply(lambda x: ('Burger King' in x) & ('McDonalds' not in x)))

输出：

                 shop        Customer  Customer ID  Amount  No_McDonalds
0           McDonalds       John Ryan            1      50         False
1           McDonalds         Jim Bob            2      32         False
2           McDonalds       Mary Ryan            3      15         False
3           McDonalds  Michael Patric            4      65         False
4         Burger King       John Ryan            1      32         False
5         Burger King         Jim Bob            2      51         False
6         Burger King       Mary Ryan            3      54         False
7         Burger King    Sean Connery            5      84          True
8         Burger King       Brad Pitt            6      52          True
9   Trump Golf Course       John Ryan            1      51         False
10  Trump Golf Course       John Ryan            1       2         False
11  Trump Golf Course  Michael Patric            4      32         False
12  Trump Golf Course       Mary Ryan            3      54         False
13  Trump Golf Course       John Ryan            1      87         False
14  Trump Golf Course         Jim Bob            2      65         False

如果你需要解释，请告诉我，我会帮助你的。你知道吗

网友

2楼 · 编辑于 2024-05-08 04:00:08

在您的情况下，我想提取或标记那些没有在麦当劳购物的汉堡王顾客，您只需执行以下操作：

s = (set(df.loc[df.shop.eq('Burger King'), 'Customer ID']) 
    - set(df.loc[df.shop.eq('McDonalds'), 'Customer ID'])
    )

输出s：

{5, 6}

要使用Buger King提取这些客户记录：

df[df.shop.eq('Burger King') & df['Customer ID'].isin(s)]

输出：

          shop      Customer  Customer ID  Amount
7  Burger King  Sean Connery            5      84
8  Burger King     Brad Pitt            6      52

网友
3楼 · 编辑于 2024-05-08 04:00:08

这是一个带有^{}和^{}的向量化解决方案。首先我们得到Burger King的行，然后我们从McDonalds得到Customers

最后检查来自Burger King的哪些客户没有去过McDonalds：

bk = df.loc[df['shop'].eq('Burger King')]
mc = df.loc[df['shop'].eq('McDonalds'), 'Customer']

bk[~bk['Customer'].isin(mc)]

          shop      Customer  Customer ID  Amount
7  Burger King  Sean Connery            5      84
8  Burger King     Brad Pitt            6      52

输出：

相关问题更多 >

编程相关推荐

热门问题

热门文章