匹配从末尾开始直到数字为hi的字符串索引

2024-10-01 15:38:33 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个python字符串,它是一个文档编号,格式为

‘A87-0000E000’或‘TRS-0000E000’

当我解析word文档中的文档编号时,有时会在字符串中得到不需要的日期和其他信息。有没有一种方法可以匹配正则表达式,或者从字符串的末尾开始的子字符串,直到得到一个数字?你知道吗

字符串长度不是固定的,因为它来自word文档

示例

line = 'A97-5000E000 Date:'

预期产量

line = 'A97-5000E000'

例2

line = 'TRS 4000E000 Page 1 of'

预期产量

line = 'TRS 4000E000'

例3

line = 'TRS 3000231 Date: Dec, 12 20'

预期产量

line = 'TRS 3000231'

Tags: 方法字符串文档信息date格式line数字
2条回答

如果所需零件的长度是固定的,则可以使用切片:
line[:12]

您可以使用这个regex ([A-Z0-9]{3}[- ])([A-Z0-9]+)\s.*,它可以:

  • ([A-Z0-9]{3}[- ])匹配一组大写字母和长度为3的degits,后跟-space
  • ([A-Z0-9]+)在下一个空格前匹配大写字母和degits的第二个组

最后的结果是第1组和第2组$1$2

regex demo

相关问题 更多 >

    热门问题