正则表达式排除特定的模式 - 问答 - Python中文网

正则表达式排除特定的模式

2024-10-03 19:25:10 发布

您现在位置：Python中文网/ 问答频道 /正文

男 | 程序猿一只，喜欢编程写python代码。

我正在写一个正则表达式来预处理一些tweet。很多时候我会遇到像hiiiii或looove之类的拼写，我试图把它们清理成hi或love来清理多个连续字符的用法。我的代码如下：

 w = re.sub(r'[^\w\s]|(.)(?=\1)', '', w)

这完成了大部分工作，但它也清除了book到bok或deep到dep这样的单词。我想从这个模式中排除oo和ee。尝试过这样做：

w = re.sub(r'(?!oo)[^\w\s]|(.)(?=\1)', '', "book")

但这不管用。请帮忙。你知道吗

Tags：代码 re 用法 hi 字符 tweet oo deep

1条回答

网友

1楼 · 发布于 2024-10-03 19:25:10

这个正则表达式怎么样？你知道吗

[^\w\s]|(.)(?=\1(?<![^o]oo|[^e]ee))

相关问题更多 >

编程相关推荐

热门问题

热门文章