Pandas Groupby捕获列oupu的第一个值时出错

DOCUMENT_LEDGER_ID ACTUAL_START_DATE 376878 2017-02-01 376880 2017-02-01 16043792 2017-01-05 16043792 2017-02-04

1条回答

网友

1楼 · 发布于 2024-04-26 07:19:53

似乎需要分配sort_values的输出，然后聚合first：

cols = ["DOCUMENT_LEDGER_ID", "ACTUAL_START_DATE"]
cycleTimeFilteringUnique = (cycleTimeFiltering.sort_values(cols)
                                              .groupby('DOCUMENT_LEDGER_ID', as_index=False)
                                              .first())

一些替代解决方案：

idx = cycleTimeFiltering.groupby("DOCUMENT_LEDGER_ID")['ACTUAL_START_DATE'].idxmin()
cycleTimeFilteringUnique = cycleTimeFiltering.loc[idx]

cols = ["DOCUMENT_LEDGER_ID", "ACTUAL_START_DATE"]
cycleTimeFilteringUnique = (cycleTimeFiltering.sort_values(cols)
                                              .drop_duplicates('DOCUMENT_LEDGER_ID'))

print (cycleTimeFilteringUnique)
   DOCUMENT_LEDGER_ID ACTUAL_START_DATE
0              376878        2017-02-01
1              376880        2017-02-01
2            16043792        2017-01-05

相关问题更多 >

编程相关推荐

热门问题

热门文章

Pandas Groupby捕获列oupu的第一个值时出错

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >