在数据帧的同一单元格中使用多个日期计算

userid recorddate alertdate 0 tom 2018-06-12 00:00:00.0 2018-06-13 00:00:00.0, 2015-04-13 00:00:00.0 1 nick 2019-06-01 00:00:00.0 2019-11-11 00:00:00.0, 2020-02-12 00:00:00.0, 2020-01-10 00:00:00.0 2 bob 2019-06-02 00:00:00.0 2019-06-01 00:00:00.0

2条回答

网友

1楼 · 编辑于 2024-10-01 04:53:00

您可以将“alertdate”值转换为具有str.split()的日期列表：

df['alertdate'] = df['alertdate'].str.split(', ')

然后，您可以使用pd.to_datetime()在行和每行的列表元素上循环进行比较

网友

2楼 · 编辑于 2024-10-01 04:53:00

方法：

我用双空格分隔符读入您的输入
我用split()将字符串转换为df['alertdate']列中的列表
我创建了一个名为df['alertdate_lt_10days']的列，该列首先假定为“否”，随后将为相关行返回“是”
我遍历了列、行和单元格，关键是：
A.第一个for语句-使用zip()同时循环遍历两列的行和b。第二个for语句-循环alertdate列单元格中的列表，以便能够比较日期，看看它们是否在10天之内
我将recorddate和alertdate字符串转换为日期，然后使用.days将timedelta对象转换为integer（默认情况下，减去日期会创建一个timedelta对象，不能与整数进行比较）
最后，我使用了非常有用和实用的np.where()为我们先前创建的新列指定了一个“是”

代码：

import pandas as pd
import numpy as np
df=pd.read_clipboard(sep='\s+\s+')

df['alertdate'] = df['alertdate'].apply(lambda x: x.split(','))
df['alertdate_lt_10days'] = 'No'
for recorddate, list_alertdate in zip(df['recorddate'], df['alertdate']):
    for alertdate in list_alertdate:
        if -10 < (pd.to_datetime(alertdate) - pd.to_datetime(recorddate)).days < 10:
            df['alertdate_lt_10days'] = np.where(df['recorddate'] == recorddate, 'Yes', df['alertdate_lt_10days'])
df

输出：

        userid  recorddate                  alertdate             alertdate_lt_10days
0       tom     2018-06-12 00:00:00.0       [2018-06-13 00:00:00.0, 2015-04-13 00:00:00.0]  Yes
1       nick    2019-06-01 00:00:00.0       [2019-11-11 00:00:00.0, 2020-02-12 00:00:00.0...    No
2       bob     2019-06-02 00:00:00.0       [2019-06-01 00:00:00.0]            Yes

相关问题更多 >

编程相关推荐

热门问题

热门文章

在数据帧的同一单元格中使用多个日期计算

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >