如何根据一行和另一列中的特定值对行进行分组？

|-------------------------------------------------| | time | name | stage | payload | |-------------------------------------------------| | 1000 | tim | basket | harrypotter;twilight; | |-------------------------------------------------| | 1001 | tim | basket | harrypotter; | |-------------------------------------------------| | 1002 | tim | checkout | Order# 123456789 | |-------------------------------------------------| | 1003 | tim | basket | pandasfordummies; | |-------------------------------------------------| | 1004 | tim | checkout | Order# 145246263 | |-------------------------------------------------|

|-------------------------------------------------| | time | name | stage | payload | |-------------------------------------------------| | 1000 | tim | basket | harrypotter;twilight; | |-------------------------------------------------| | 1001 | tim | basket | harrypotter; | |-------------------------------------------------| | 1002 | tim | checkout | Order# 123456789 | |-------------------------------------------------|

|-------------------------------------------------| | time | name | stage | payload | |-------------------------------------------------| | 1003 | tim | basket | pandasfordummies; | |-------------------------------------------------| | 1004 | tim | checkout | Order# 145246263 | |-------------------------------------------------|

1条回答

网友

1楼 · 发布于 2024-10-02 00:27:09

假设您的表位于pandas数据框中，并且已按时间和名称排序，则可以使用以下代码：

import numpy as np
import pandas as pd

df = pd.DataFrame({'time': [1000, 1001, 1002, 1003, 1004],
               'name':['tim', 'tim', 'tim', 'tim', 'tim'],
               'stage':['basket', 'basket', 'checkout', 'basket', 'checkout'],
               'payload':['harrypotter;twilight;', 'harrypotter;', 'Order# 123456789', 'pandasfordummies;', 'Order# 145246263']})

orders = np.split(df, np.where(df.stage == 'checkout')[0] + 1)

这将在orders中创建一个分割数据帧数组，您可以像orders[0]、orders[1]等正常访问该数组

相关问题更多 >

编程相关推荐

热门问题

热门文章