获取一系列行中的单元格的最新值，这些行中共享一个唯一标识符

aframe.columns = ['ID','blah2', 'blah3', 'integer1'.......] aframe['integer1'] = aframe['integer1'].convert_objects(convert_numeric='force') aframe['integer2'] = aframe['integer2'].convert_objects(convert_numeric='force') aframe['integer3'] = aframe['integer3'].convert_objects(convert_numeric='force') aframe['integer4'] = aframe['integer4'].convert_objects(convert_numeric='force') aframe = aframe.groupby(['ID', 'blah1', 'blah2',......]) aframe.to_csv(outputFile)

1条回答

网友

1楼 · 发布于 2024-10-05 14:23:30

对于每列指定的函数，可以使用groupby('ID')后跟aggregate：

import pandas as pd
data = [['A', 'On', 34],
        ['B', 'Off', 76],
        ['A', 'Off', 34],
        ['B', 'On', 23]]
df = pd.DataFrame(columns=('ID', 'Blah', 'Integer'), data=data)
df
>>>     ID  Blah    Integer
>>> 0   A   On      34
>>> 1   B   Off     76
>>> 2   A   Off     34
>>> 3   B   On      23

df.groupby('ID').aggregate({'Blah': 'last', 'Integer': 'mean'})
>>>     Blah    Integer
>>> ID      
>>> A   Off     34.0
>>> B   On      49.5

相关问题更多 >

编程相关推荐

热门问题

热门文章