Pandas重采样不累加

In [48]: x=rank.groupby(rank.sum(axis=1)) In [49]: x.sum() Out[49]: <class 'pandas.core.frame.DataFrame'> Index: 1 entries, 10.0 to 10.0 # all rows sum to 10 as expected. Columns: 461 entries, AKM to ZIM dtypes: float64(461)

In [67]: rank=rank.fillna(0) In [68]: x=rank.groupby(rank.sum(axis=1)) In [69]: x.sum() Out[69]: <class 'pandas.core.frame.DataFrame'> Index: 2 entries, 0.0 to 10.0 # 2 entries, 0 and 10 Columns: 461 entries, AKM to ZIM dtypes: float64(461) In [70]: port = rank.resample('20B', how='first') In [71]: y=port.groupby(port.sum(axis=1)) In [72]: y.sum() Out[72]: <class 'pandas.core.frame.DataFrame'> Index: 2 entries, 0.0 to 10.0 # 2 entries again, 0 and 10 Columns: 461 entries, AKM to ZIM dtypes: float64(461)

1条回答

网友

1楼 · 发布于 2024-09-27 02:25:47

{non-reason>从每个列中取一个值，因为这是第一个。这就是为什么在NAs中填充0可以得到正确的答案。要在不填充NAs的情况下获得所需的行为，可以将自定义函数传递给how，而不管它是否为NA:

In [47]: port = rank.resample('20B', how=lambda x: x.ix[0])

In [48]: y=port.groupby(port.sum(axis=1))

In [49]: y.sum()
Out[49]: 
<class 'pandas.core.frame.DataFrame'>
Index: 1 entries, 10.0 to 10.0
Columns: 461 entries, AKM to ZIM
dtypes: float64(461)

相关问题更多 >

编程相关推荐

热门问题

热门文章