如何合并多个唯一id

2024-06-30 13:53:43 发布

您现在位置:Python中文网/ 问答频道 /正文

我的数据如下:

Id  Car     Code    ShowTime
1   Honda    A      10/18/2017 14:45
2   Honda    A      10/18/2017 17:10
3   Honda    C      10/18/2017 19:35
4   Toyota   B      10/18/2017 12:20
5   Toyota   B      10/18/2017 14:45

如果包含唯一的Id,下面的代码将返回多个实例输出:

all_car_schedules = db.session.query(Schedules.id, Schedules.code,
                                      Car.carname, Schedules.showtime) \
                               .filter(Schedules.id == Car.id)

df = pd.read_sql(all_car_schedules.statement, db.session.bind)

df[['show_date', 'start_times', 'median']] = df.showtime.str.split(' ', expand=True)
df['start_times'] = df['start_times'] + df['median']
df.drop('screening', axis=1, inplace=True)
df.drop('median', axis=1, inplace=True)
df_grp = df.groupby(['id', 'code', 'carname'])
df_grp_time_stacked = df_grp['start_times'].apply(list).reset_index()
df_grp_time_stacked['start_times'] = df_grp_time_stacked['start_times'].apply(lambda x: x[0] if (len(x) == 1) else x)
return_to_dict = df_grp_time_stacked.to_dict(orient='records')

当预期输出应为以下值时,上面的代码返回多行:

"data":{
        'id': '1',
        'schedule': {
            'car': 'Honda',
            'show_date': '10/18/2017',
            'time_available': [
                '14:45',
                '17:10',        
            ],
            'code': 'A'

        }
    },{
        'id': '3',
        'schedule': {
            'car': 'Honda',
            'show_date': '10/18/2017',
            'time_available': [
                '19:35'
            ],
            'code': 'C'
        }
    },{
        'id': '4',
        'schedule': {
            'car': 'Toyota',
            'show_date': '10/18/2017',
            'time_available': [
                '12:20',
                '14:45'
            ],
            'code': 'B'
        }
    }

我还使用sqlite3作为db。我不确定查询中是否应该有更改。请让我知道你的想法并帮助我。非常感谢。我还使用sqlite3作为db


Tags: iddfdbdatetimeshowcodecar
1条回答
网友
1楼 · 发布于 2024-06-30 13:53:43

可以将groupby()函数与list选项结合使用:

df = pd.DataFrame({'Id' : [1,2,3,4,5], 'Car': ['Honda', 'Honda', 'Honda', 'Toyota', 'Toyota'],
                    'Code': ['A', 'A', 'B', 'C', 'C'], 'show date': ['10/18/2017', '10/18/2017',
                                                                     '10/18/2017', '10/18/2017', '10/18/2017'],
                   'start_times' : ['14:45', '17:10', '19:35', '12:20', '14:45']})

df.groupby(['Car', 'Code', 'show date'])['start_times'].apply(list)

输出:

                           start_times
Car    Code show date                 
Honda  A    10/18/2017  [14:45, 17:10]
       B    10/18/2017         [19:35]
Toyota C    10/18/2017  [12:20, 14:45]

如果要保留第一个id,必须将选项'first'添加到id行,如下所示:

df.groupby(['Car', 'Code', 'show date']).agg({'start_times' : list, 'Id' : 'first'})

# Output
                  start_times  Id
Car    Code show date                     
Honda  A    10/18/2017  [14:45, 17:10]   1
       B    10/18/2017         [19:35]   3
Toyota C    10/18/2017  [12:20, 14:45]   4

相关问题 更多 >