数十万字中,有两个例子——
JANE_FONDA_AM_PM_YOGA_FOR_BEGINNERS
JANE_FONDA_EN
我需要的输出是:
JANE_FONDA_AM_PM_YOGA_FOR_BEGINNERS
JANE_FONDA
我想到的正则表达式是:
vendor_id_stem = re.sub(r'(_[A-Za-z_]*|_?[A-Za-z]{2,4}?\d?)$', "", vendor_id)
它现在给了我:
JANE # BAD
JANE_FONDA # GOOD
我需要它做的是确保如果没有像“en001”这样的结尾,它不会剥离任何东西,我如何修改现有的regex表达式来做到这一点
试试这个:
相关问题 更多 >
编程相关推荐