需要使用python正则表达式提取字符的帮助吗

3条回答

网友

1楼 · 编辑于 2024-09-21 05:43:30

import re
x = "20200702_abcd_ef_aed_usd_cdee_hgd.csv"
y = re.search(r"[a-zA-Z][_A-Za-z]+",x)
print(y[0])

由于在字符串的开头不需要任何下划线，因此必须指定[a-zA-Z]，然后在剩余的[_a-zA-z]+后面指定，更正是在开始处添加[a-zA-Z]

网友

2楼 · 编辑于 2024-09-21 05:43:30

在这里，您实际上不必依赖正则表达式。您可以get the file name without extension，然后使用_将其拆分为两部分，并得到最后一部分：

import os
s = "20200702_abcd_ef_aed_usd_cdee_hgd.csv"
print( os.path.splitext(s)[0].split('_', 1)[-1] )

对于regex，您还可以尝试一种re.sub解决方案，该解决方案还可以确保仅从开始处删除数字+_：

re.sub(r'^\d+_|\.[^.]*$', '', s)

或者，如果不需要进行数字检查：

re.sub(r'^[^_]+_|\.[^.]*$', '', s)

详细信息

网友

3楼 · 编辑于 2024-09-21 05:43:30

尝试：

re.search('[a-z][a-z_]+', "20200702_abcd_ef_aed_usd_cdee_hgd.csv").group()