我在和Python和熊猫一起工作。我有一个如下所示的数据帧:
codename date
AAA 13-03-2015
AAB 20-02-2015
AAB 15-04-2015
AAB 20-04-2015
AAB 21-04-2015
AAB 21-05-2015
我正在寻求帮助计算30天内的一系列事件。我试图在下面的表格中说明我希望实现的目标:
codename date daysBetween series
AAA 13-03-2015 NaN 1
AAB 20-02-2015 NaN 1
AAB 15-04-2015 54 1
AAB 20-04-2015 5 0
AAB 21-04-2015 6 0
AAB 21-05-2015 36 1
如果从单元格1(20-02-2015)到单元格(15-04-2015)的时间超过30天,则计算(54天)之间的时间,将结果放入daysBetween
,并将1放入series
如果两个单元格之间经过的时间不超过30天,则计算天数并按系列输入0
日期应与序列为1的最后一个日期进行比较
我设法按代号和日期排序:
import pandas as pd
file = pd.read_excel('sample.xlsx')
sortedData = file.sort_values(by=['codename', 'date'])
我认为您需要通过^{} 比较值,并通过^{} 转换为整数,以便
True/False
到1/0
映射:如果需要值之间的差异:
相关问题 更多 >
编程相关推荐