如何在特定单词之前使用python正则表达式提取单词

2024-09-26 22:49:29 发布

您现在位置:Python中文网/ 问答频道 /正文

我需要在一个特定的单词之前提取单词。在

我的数据是。在

data="""70MHeAhULOY8KHVLaBwcQHzAAegQICBAF">Similar</a>
</li></ol></div></div></span></div><div class="s"><div> 
 <span class="st">Mail: Consumer Advisory Service, PO Box 
 1673, MELBOURNE <em>VIC</em> 3001. Email: Click here to 
contact us via email. Any personal information you give 
 ;...kJP70MHeAhULOY8KHVLaBwcQIDAKegQIBxAE">Cached  </a>
 </li></ol></div></div></span></div><div class="s"><div> 
 <span class="st">Australia. Consumer Advisory Service 
 GPO Box 
1673. MELBOURNE, <em>VIC</em>, 3001. AUSTRALIA. New Zealand. 
Cadbury Freepost 577. PO Box 890. Dunedin&nbsp;...</span>

我试图提取'VIC'之前的单词

我的预期输出是['1673, MELBOURNE','1673. MELBOURNE,'],因为我的数据中有两个匹配项

我的代码: re.find_all(r"\*+\s(\*) <em> vic",data)

但不起作用


Tags: 数据divboxdataconsumerli单词class
1条回答
网友
1楼 · 发布于 2024-09-26 22:49:29

您可以使用此正则表达式精确提取VIC之前的两个单词

\s+([^\s]+?\s+[^\s]+?)\s*<em>VIC<\/em>

Demo

下面是一个python示例代码

^{pr2}$

这会产生以下输出:

['1673, MELBOURNE', '1673. MELBOURNE,']

相关问题 更多 >

    热门问题