好吧,我有一个(大)数据帧,类似这样:
date time value
0 20100201 0 1
1 20100201 6 2
2 20100201 12 3
3 20100201 18 4
4 20100202 0 5
5 20100202 6 6
6 20100202 12 7
7 20100202 18 8
8 20100203 0 9
9 20100203 18 11
10 20100204 6 12
...
8845 20160101 18 8846
如您所见,dataframe有一列date
,一列time
,每天4小时(00、06、12、18)和一列value
。在
问题是数据帧中缺少日期,在上面的示例中,第8行和第9行之间应该有两行额外的行,分别对应于当天的小时6
和{0
相对应。在
我需要什么?我想迭代dataframe的date
列,检查每天是否存在并且没有人失踪,并且每天都有四个小时(00、06、12、18)。如果在迭代过程中丢失了某些内容,则应该在中精确地添加到中,并将缺少的date
和{
如果您感兴趣,这里会询问这个问题的一个更简单的版本Modular arithmetic in python to iterate a pandas dataframe,用户@Alexander和@piRSquared友好地回答了这个问题。这里要求的版本是一个更困难的版本,包括(我想)使用datetime和timedelta以及迭代更多的列。在
很抱歉给你发了这么长的信,非常感谢。在
您可以使用^{} 来重塑形状-在第},然后使用^{} 和{a4}得到{a2}:
^{pr2}$time
列的缺失值中得到{如果你需要漂亮的} 再来一次,比如:
index
,也许你可以^{好的,谢谢,差不多完成了,有点遗漏,我需要订购数据帧,即每天,从20100201开始,第一行是00小时,第二行是06,第三行是12,第四行是18,然后20100202从00小时开始,一直到2016年的最后一天。。。这个顺序对于能够对数据进行一些统计是很重要的。让我告诉你我得到了什么:
(顺便说一句,在
value
列中很可能出现重复的情况下,我想没有问题,对吧?该解决方案旨在同时消除其他两列中的重复项,对吗?)在相关问题 更多 >
编程相关推荐