我在我的文本文件中发现了一些由图像文件引起的随机代码,我想删除这些以字母或数字开头但以“PM”结尾的随机代码:
例如,有一个文本:
iSD08LXjpg2021330401PM大陸不可以給60歲以上人士打香港專找60歲以上人士去打,做白老鼠
日本與美國比還是很不錯的USA死亡才多呢日媒體報道jpg2021321056PM
理想的结果是:
大陸不可以給60歲以上人士打香港專找60歲以上人士去打,做白老鼠
日本與美國比還是很不錯的USA死亡才多呢日媒體報道
但我不知道如何使用re来移除它
Tags:
使用
re.sub
删除字符串开头或结尾的所有ascii(ord 0-127)字符您希望删除以PM结尾的罗马字母和阿拉伯数字的每个连续段。这是通过一个简单的正则表达式实现的:
[a-zA-Z0-9]*PM
a-z
描述所有小写拉丁字母的范围,相当于A-Z
和0-9
*
表示任意数量的字符,因为字符串可能具有任意长度PM
是固定端字符串当然,您必须确保这些字符串不包含像
ü
这样的特殊字符。如果有,请根据需要添加字符组实际的python代码将是
相关问题 更多 >
编程相关推荐