我在pandas中有一个名为“munged_data”的数据框,其中有两列“entry_date”和“dob”,我使用pd.to_timestamp将其转换为时间戳。我正在尝试根据“entry_date”和“dob”之间的时间差来计算人的年龄,为此,我需要得到这两列之间的天数差(这样我就可以做一些类似的事情了(days/365.25)。我似乎找不到使用矢量化操作来实现这一点的方法。当我在munged_data.entry_date-munged_data.dob时,我得到以下信息:
internal_quote_id
2 15685977 days, 23:54:30.457856
3 11651985 days, 23:49:15.359744
4 9491988 days, 23:39:55.621376
7 11907004 days, 0:10:30.196224
9 15282164 days, 23:30:30.196224
15 15282227 days, 23:50:40.261632
不过,我似乎无法将天数提取为整数,以便继续计算。 感谢任何帮助。
不确定您是否还需要它,但在Pandas 0.14中,我通常使用.astype('timedelta64[X]')方法 http://pandas.pydata.org/pandas-docs/stable/timeseries.html(变频)
返回:
返回:
希望这会有帮助
使用从v0.15.0开始提供的Pandas类型^{} ,您还可以执行以下操作:
这个需要0.11(0.11rc1不在,下周最后一个prob)
您需要在末尾使用这个奇怪的应用程序,因为还没有完全支持timedelta64[ns]标量(例如,我们现在如何为datetime64[ns]使用时间戳,是0.12)
相关问题 更多 >
编程相关推荐