从给定的文本/字符串中提取时间戳
datetime-extractor的Python项目详细描述
日期时间提取程序
这个项目的主要目的是从一个给定的字符串中提取所有可能的时间戳,其中日期和时间一起写入。它以字符串格式提取timestaamp。稍后可以使用pandas datetime包将提取的时间戳转换为python时间戳。
如何安装软件包
pip install datetime-extractor
示例1
fromdatetime_extractorimportDateTimeExtractorimportpandasaspdimportresamplestring='scala> val xorder= new order(1,"2016-02-22 00:00:00.00",100,"COMPLETED")'DateTimeExtractor(samplestring)Out:['2016-02-22 00:00:00.00']
示例2
假设有一个带有文本列的dataframe,其中写入了时间戳,那么可以使用上面的函数创建一个带有提取的时间戳字符串的新列。在这种情况下,可以使用下面的命令
data=pd.read_csv('sampledata.csv')data['textcolumn']=data['textcolumn'].fillna('')data['ExtractedTimestamp']=data['textcolumn'].apply(lambdax:DateTimeExtractor(str(x)))