如何使用Pandas滚动。应用有计算多列的功能吗?

2024-09-29 23:24:54 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个带有日期和id(排序)的数据帧。你知道吗

> date              id        newid (expected result)
> 2019-01-01 10:00   1   20190101000001-A
> 2019-01-01 11:00   1   20190101000002-A
> 2019-01-01 12:00   1   20190101000003-A
> 2019-01-01 19:00   2   20190101000001-A
> 2019-01-02 09:00   2   20190102000001-A
> 2019-01-02 10:00   2   20190102000002-A
> 2019-01-05 15:00   3   20190103000001-A

def create_new_id(params):
    if (previous_date != recent_date) or (previous_id != recent_id):
        new_id = 'date000001-A'

    if (previous_date == recent_date) and (previous_id == recent_id):
        new_id = previous_new_id + 1# (change date000001-A to date000002-A)

    return new_id

作为一个示例数据,我想通过创建一个条件来检查前一个值来生成一个新的id。你知道吗

我试着用这个

df['newid ] = df.rolling(window=2).apply(create_new_id)

但我不知道正确的使用方法。你知道吗


Tags: 数据iddfnewdateif排序def
1条回答
网友
1楼 · 发布于 2024-09-29 23:24:54

试试看

df['newid'] = df['date'].dt.strftime('%Y%m%d')+(df.groupby([df['date'].dt.date,'id']).cumcount()+1).astype(str).str.zfill(6) + '-A'
print(df)

# print
                 date  id             newid
0 2019-01-01 10:00:00   1  20190101000001-A
1 2019-01-01 11:00:00   1  20190101000002-A
2 2019-01-01 12:00:00   1  20190101000003-A
3 2019-01-01 19:00:00   2  20190101000001-A
4 2019-01-02 09:00:00   2  20190102000001-A
5 2019-01-02 10:00:00   2  20190102000002-A
6 2019-01-05 15:00:00   3  20190105000001-A

相关问题 更多 >

    热门问题