Python Pandas groupby和mutate一个新列，其中包含组计算ala dply

2024-09-29 06:29:29 发布

男 | 程序猿一只，喜欢编程写python代码。

对于数据分析，我相当熟悉rdplyr，我正在尝试将我用dplyr编写的一些代码转换成pandas。我有一个由ID列标识的人的数据，以及该人使用某个产品的日期。我正试图找出将下面的rdplyr代码转换为python pandas代码的最佳方法。基本上，我按ID列进行分组，筛选特定类型的产品，然后添加一列（对于组中的每一行）添加该人员和产品的最小（首次使用）日期和最大（最后使用）日期。最后，我还添加了一个列，用于计算上次使用日期和首次使用日期之间的天数。数据如下：

ID  PRODUCT DATE
A   ITEM1   1/30/15
B   ITEM1   2/23/14
A   ITEM2   3/22/15
C   ITEM1   1/23/12
B   ITEM1   4/12/15
A   ITEM3   2/2/14
C   ITEM1   1/1/17
A   ITEM1   2/20/15
A   ITEM1   5/18/15

使用dplyr我可以做到

^{pr2}$

这给了我

      ID PRODUCT       DATE      FIRST       LAST      DAYS
  (fctr)  (fctr)     (time)     (time)     (time)    (dfft)
1      A   ITEM1 2015-01-30 2015-01-30 2015-05-18  108 days
2      B   ITEM1 2014-02-23 2014-02-23 2015-04-12  413 days
3      C   ITEM1 2012-01-23 2012-01-23 2017-01-01 1805 days
4      B   ITEM1 2015-04-12 2014-02-23 2015-04-12  413 days
5      C   ITEM1 2017-01-01 2012-01-23 2017-01-01 1805 days
6      A   ITEM1 2015-02-20 2015-01-30 2015-05-18  108 days
7      A   ITEM1 2015-05-18 2015-01-30 2015-05-18  108 days

数据：

df <- structure(list(ID = structure(c(1L, 2L, 1L, 3L, 2L, 1L, 3L, 1L, 1L), .Label = c("A", "B", "C"), class = "factor"), 
               PRODUCT = structure(c(1L, 1L, 2L, 1L, 1L, 3L, 1L, 1L, 1L), .Label = c("ITEM1", "ITEM2", "ITEM3"), class = "factor"), 
               DATE = structure(c(3L, 6L, 7L, 2L, 8L, 4L, 1L, 5L, 9L), 
                                .Label = c("1/1/17", "1/23/12", "1/30/15", "2/2/14", "2/20/15", "2/23/14", "3/22/15", "4/12/15", "5/18/15"), 
                                class = "factor")), 
               .Names = c("ID", "PRODUCT", "DATE"), class = "data.frame", row.names = c(NA, -9L))

我怎么能在熊猫身上做同样的事？在

Tags：数据代码 id date time 产品 product days

1条回答

网友

1楼 · 发布于 2024-09-29 06:29:29

使用agg+groupby

funcs = dict(FIRST='min', LAST='max', DAYS=np.ptp)
d1 = df.join(df.groupby(['ID', 'PRODUCT']).DATE.agg(funcs), on=['ID', 'PRODUCT'])

Python Pandas groupby和mutate一个新列，其中包含组计算ala dply

相关问题更多 >

编程相关推荐

热门问题

热门文章

Python Pandas groupby和mutate一个新列，其中包含组计算ala dply

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >