我正在编写一个处理数据帧的函数。此数据帧中的行由日期时间索引索引,并且数据帧中每小时有一行。 基本上,经过一些处理后,我得到的是:
inquinante temperatura precipitazioni ... umidita day_of_year day_of_week
Data ...
2000-07-04 00:00:00 55.0 23.9 0.0 ... 86.8 186 1
2000-07-04 01:00:00 NaN 23.4 0.0 ... 86.2 186 1
2000-07-04 02:00:00 NaN 22.7 0.0 ... 92.5 186 1
2000-07-04 03:00:00 NaN 22.1 0.0 ... 97.5 186 1
2000-07-04 04:00:00 NaN 22.2 0.0 ... 95.9 186 1
现在,我想筛选出列'inquinante'的值为NaN的行,因此我编写了以下代码行:
df = df.dropna(subset=["inquinante"])
但我在它执行后得到的是:
inquinante temperatura precipitazioni ... umidita day_of_year day_of_week
Data ...
2014-01-31 25.0 4.700000 1.000000 ... 95.700000 31 4
2014-02-01 31.0 5.800000 0.000000 ... 94.800000 32 5
2014-02-02 20.0 6.100000 1.800000 ... 97.300000 33 6
2014-02-03 17.0 6.700000 0.600000 ... 96.300000 34 0
2014-02-04 18.0 6.600000 0.800000 ... 97.200000 35 1
为什么现在我的约会是按天而不是按小时来安排的? 我还尝试将代码行更改为:
df = df[df.inquinante >= 0]
#or
df = df[df.inquinante.notna()]
但这些似乎都无法解决问题。我有没有办法解决这个问题,防止熊猫把我的约会分组
提前谢谢
你可以试试这样的东西-
当所有索引标签的时间戳为午夜或时间00:00:00时,这是datetime索引的自动表示形式
输出:
现在,让我们放下所有时间,其中小时=12,只留下午夜时间戳:
输出:
这仍然是一个datetimeindex,每个标签都有一个时间戳
输出:
如果只更改了日期的格式而没有更改值,则始终可以按如下方式将其转换回:
相关问题 更多 >
编程相关推荐