向正则表达式添加限制

2024-09-21 07:36:30 发布

男 | 程序猿一只，喜欢编程写python代码。

数十万字中，有两个例子——

JANE_FONDA_AM_PM_YOGA_FOR_BEGINNERS
JANE_FONDA_EN

我需要的输出是：

JANE_FONDA_AM_PM_YOGA_FOR_BEGINNERS
JANE_FONDA

我想到的正则表达式是：

vendor_id_stem = re.sub(r'(_[A-Za-z_]*|_?[A-Za-z]{2,4}?\d?)$', "", vendor_id)

它现在给了我：

JANE # BAD
JANE_FONDA # GOOD

我需要它做的是确保如果没有像“en001”这样的结尾，它不会剥离任何东西，我如何修改现有的regex表达式来做到这一点

Tags： re id for am 例子 en vendor bad

2条回答

网友

1楼 · 编辑于 2024-09-21 07:36:30

var s = "JANE_FONDA_EN"
s.replace(/_EN.*[^_]/, '');

> "JANE_FONDA"

网友

2楼 · 编辑于 2024-09-21 07:36:30

试试这个：

vendor_id_stem = re.sub(r'(_[A-Za-z]*|_?[A-Za-z]{2,4}?\d?)$', "", vendor_id)