合并具有相同索引的行并为行da创建新列

Close Symbol Date AA 1/20/1998 29.530121 1/14/2021 25.09 AIG 1/20/1998 485.831665 1/14/2021 41.299999 AXP 1/20/1998 17.698372 ... ... ... WMT 1/14/2021 146.970001 XOM 1/20/1998 15.515985 1/14/2021 50.310001

Start Date End Date Start Close End Close Symbol AA 1/20/1998 1/14/2021 29.530121 25.09 AIG 1/20/1998 1/14/2021 485.831665 41.299999 AXP 1/20/1998 1/14/2021 17.698372 123.78 ... ... ... ... ... VZ 1/20/1998 1/14/2021 14.96 57.040001 WMT 1/14/2021 Nan 146.970001 Nan XOM 1/20/1998 1/14/2021 15.515985 50.310001

1条回答

网友

1楼 · 发布于 2024-10-02 06:21:52

获取样本数据并重置索引

df = df.reset_index()

Symbol  Date    Close
0   AA  1/20/1998   29.530121
1   AA  1/14/2021   25.090000
2   AIG 1/20/1998   485.831665
3   AIG 1/14/2021   41.299999
4   WMT 1/14/2021   146.970001
5   XOM 1/20/1998   15.515985
6   XOM 1/14/2021   50.310001

您可以按Symbol分组，并获取该组中的所有Date和Close，然后创建一个包含两个日期和两个结束日期的序列，该序列将作为与符号对应的行

def func(df):
    dates = df['Date'].values.tolist()
    closes = df['Close'].values.tolist()
    if len(dates) == 1: # if there is one date,then End Date and End Close would be nans
        dates += [np.nan]
        closes += [np.nan]
    return pd.Series(dates + closes, index=['Start Date', 'End Date',
                                            'Start Close', 'End Close'])

df = df.groupby('Symbol')[['Date', 'Close']].apply(func)

df
    Start Date  End Date    Start Close End Close
Symbol              
AA  1/20/1998   1/14/2021   29.530121   25.090000
AIG 1/20/1998   1/14/2021   485.831665  41.299999
WMT 1/14/2021   NaN         146.970001  NaN
XOM 1/20/1998   1/14/2021   15.515985   50.310001

编辑：

有一种更简单的方法。可以使用unstack创建新列cumcount对组中的每个项目进行编号，用于知道每个组有多少行，以便相应地更新列

out_df = df.set_index(['Symbol', df.groupby('Symbol').cumcount()]).unstack()
out_df.columns = [f'Start {c1}' if c2 == 0 else f'End {c1}' for c1, c2 in out_df.columns]

编辑：

相关问题更多 >

编程相关推荐

热门问题

热门文章