尝试使用非uniqu列的条件生成伪代码以应用于pandas

counter = 0 break the table to group by order_id For each group{ For each index within the group{ If (name of product) has the word "organic" {x = true} else {x = false} } If x = true, {add 1 to counter} }

Order_id | Name | 1 organic bread 1 organic beans 1 regular milk 2 organic milk 2 organic lettuce 3 regular orange 3 regular bread Output: counter = 1

1条回答

网友

1楼 · 发布于 2024-09-29 01:36:43

用途：

counter = df['Name'].str.contains('organic').groupby(df['Order_id']).all().sum()
print (counter)
1

详细说明：

如果匹配的organic输出是布尔掩码，则通过^{}进行Tirst测试：

print (df['Name'].str.contains('organic'))
0     True
1     True
2    False
3     True
4     True
5    False
6    False
Name: Name, dtype: bool

然后使用^{}检查每个组的所有True：

print (df['Name'].str.contains('organic').groupby(df['Order_id']).all())
Order_id
1    False
2     True
3    False
Name: Name, dtype: bool

sum的True最后计数数：

counter = df['Name'].str.contains('organic').groupby(df['Order_id']).all().sum()
print (counter)
1

或者另一个aprioach是get allOrder_idif not containsorganicvalue by~for invert mask，然后减去集合并检查其长度：

groups = df.loc[~df['Name'].str.contains('organic'), 'Order_id']
counter = len(set(df['Order_id']) - set(groups))
print (counter)
1

相关问题更多 >

编程相关推荐

热门问题

热门文章