当在安装的Pandas版本(1.1.5)中使用GoogleColab时,我在尝试聚合分组数据时遇到了一个非常奇怪的错误
假设我加载一个包含nycflights列的数据帧,我按carrier
分组,然后计算平均值:
import pandas as pd
flights = pd.read_csv('nycflights.csv')
flights.groupby('carrier').mean()
这是完美的工作方式(为了清晰起见,我省略了一些行和列):
如果我计算std
或median
而不是mean
,则与预期一样工作。但是,如果我使用max
或min
,则会出现一条奇怪的错误消息:
import pandas as pd
flights = pd.read_csv('nycflights.csv')
flights.groupby('carrier').max()
我在adifferent StackOverflow thread中发现了这个错误,但是接受的响应与这个问题无关
经过一些研究,我注意到:
.max(numeric_only=True)
,则不会发生这种情况李>有人会说问题在于GroupBy.max()
的默认行为已从一个版本更改为另一个版本。事实并非如此,对于版本1.1.5和1.3.4,方法文档是相同的
关于如何执行这些聚合函数,是否存在已知问题?我没有发现这方面的任何情况
目前没有回答
相关问题 更多 >
编程相关推荐