在dataframe Python中的文本列中查找日期和时间

df = {'Id': ['001', '002',...], 'Description': [' THERE IS AN INTERUPTION/FAILURE @ 9.6AM ON 27.1.2020 FOR JB BRANCH. THE INTERUPTION ALSO INVOLVED A, B, C AND SOME OTHER TOWN AREAS. OTC AND SST SERVICES INTERRUPTED AS GENSET ALSO WORKING AT THAT TIME. WE CALL FOR SERVICE. THE TECHNICHIAN COME AT 10.30AM. THEN IT BECOME OK AROUND 10.45AM', 'today is 23/3/2013 @10:AM we have',...], .... } df = pd.DataFrame (df, columns = ['Id','Description'])

1条回答

网友

1楼 · 发布于 2024-09-30 06:23:33

这里有两个问题

您想知道如何在数据帧上应用函数
您需要一个函数来从一堆文本中提取模式

下面是如何在序列上应用函数（如果像我那样只选择一列，则得到一个序列）。加分：阅读DataFrame.apply()和Series.apply()文档（30秒）成为一名熊猫

def do_something(x):
    some-code()

df['new_text_column'] = df['original_text_column'].apply(do_something)

这里有一种使用正则表达式从字符串中提取模式的方法。阅读regex doc（或跟随a course）并与RegExr一起玩，成为一个无所不知的神（也就是说，如果您在Linux上使用命令行以及您的正则表达式知识）

修改自：How to extract the substring between two markers?

import re    
text = 'gfgfdAAA1234ZZZuijjk'
# Searching numbers.
m = re.search('\d+', text)
if m:
    found = m.group(0)
# found: 1234

相关问题更多 >

编程相关推荐

热门问题

热门文章