通过的项目数量错误1,放置意味着3(1.1.5)

2024-04-19 05:44:43 发布

您现在位置:Python中文网/ 问答频道 /正文

当在安装的Pandas版本(1.1.5)中使用GoogleColab时,我在尝试聚合分组数据时遇到了一个非常奇怪的错误

假设我加载一个包含nycflights列的数据帧,我按carrier分组,然后计算平均值:

import pandas as pd
flights = pd.read_csv('nycflights.csv')
flights.groupby('carrier').mean()

这是完美的工作方式(为了清晰起见,我省略了一些行和列):

Dataframe after aggregation with mean

如果我计算stdmedian而不是mean,则与预期一样工作。但是,如果我使用maxmin,则会出现一条奇怪的错误消息:

import pandas as pd
flights = pd.read_csv('nycflights.csv')
flights.groupby('carrier').max()

Error when using max

我在adifferent StackOverflow thread中发现了这个错误,但是接受的响应与这个问题无关

经过一些研究,我注意到:

  • 如果将Pandas更新为1.3.4版,则不会发生这种情况
  • 如果使用.max(numeric_only=True),则不会发生这种情况

有人会说问题在于GroupBy.max()的默认行为已从一个版本更改为另一个版本。事实并非如此,对于版本1.1.51.3.4,方法文档是相同的

关于如何执行这些聚合函数,是否存在已知问题?我没有发现这方面的任何情况