我对python和一般的代码都非常陌生。我有一些数据在1分钟的时间间隔,这是可能丢失一些时间。我想填写缺失的时间和对应数据点的NaN值。这是我到目前为止,它是填补了所有数据点,而不仅仅是丢失的南。你知道吗
import pandas as pd
df = pd.read_csv("data3.csv", index_col="DateTime")
df = df.reindex(pd.date_range("11-1-2014 12:00:00", "11-1-2014 12:10:00", freq="1min"), fill_value="NaN")
df.to_csv("test3.csv")
我正在阅读的文件
NSERC_CB04_A0401
DateTime
11/1/2014 0:00 1.121889
11/1/2014 0:01 1.121889
11/1/2014 0:02 1.121889
11/1/2014 0:03 1.121889
11/1/2014 0:04 1.118503
11/1/2014 0:05 1.121889
11/1/2014 0:06 1.121889
11/1/2014 0:07 1.121889
11/1/2014 0:09 1.121889
11/1/2014 0:10 1.121889
我正在写的文件
NSERC_CB04_A0401
2014-11-01 12:00:00 NaN
2014-11-01 12:01:00 NaN
2014-11-01 12:02:00 NaN
2014-11-01 12:03:00 NaN
2014-11-01 12:04:00 NaN
2014-11-01 12:05:00 NaN
2014-11-01 12:06:00 NaN
2014-11-01 12:07:00 NaN
2014-11-01 12:08:00 NaN
2014-11-01 12:09:00 NaN
2014-11-01 12:10:00 NaN
我想要什么:
NSERC_CB04_A0401
DateTime
11/1/2014 0:00 1.121889
11/1/2014 0:01 1.121889
11/1/2014 0:02 1.121889
11/1/2014 0:03 1.121889
11/1/2014 0:04 1.118503
11/1/2014 0:05 1.121889
11/1/2014 0:06 1.121889
11/1/2014 0:07 1.121889
2014-11-01 12:08:00 NaN
11/1/2014 0:09 1.121889
11/1/2014 0:10 1.121889
没问题,您在编码和python方面都是新手!你知道吗
您需要将参数} ,以便首先将} -从
parse_dates=True
添加到^{index
转换为DatetimIndex
,然后再将^{11-1-2014 12:00:00
开始的时间更改为11-1-2014 00:00:00
以进行匹配,类似的结束时间。你知道吗另外字符串
NaN
不是缺失值,您需要np.nan
什么是reindex
中缺失数据的默认值。你知道吗更一般的解决方案是
reindex
乘min
和max
datetime
,但这取决于您的数据:如果索引解决方案中的重复项是^{} ,具有一些聚合函数,如
mean
,sum
-也就是seresample docs:相关问题 更多 >
编程相关推荐