正则表达式,用于从臃肿的描述中删除城市和州

2024-09-30 18:23:06 发布

您现在位置:Python中文网/ 问答频道 /正文

你可以在这里看到描述http://www.mdh.org/sites/www/healthapp/jobs/View.aspx?id=10

MDH Human Resources

525 E. Grant St.

Macomb, IL 61455

T: 309-836-1577

F: 309-836-1677

这个页面有这个地址,我想提取城市和州使用正则表达式。在这种情况下,是马库姆和伊尔。你知道吗

有一段时间,我使用了下面的正则表达式,但在描述包含多个相似模式的情况下,它不起作用。你知道吗

(\w+),\s+(\w{2})\s+\d+

如何编写regex,它告诉我们首先提取这些地址行,然后提取具有这种模式的行?你知道吗


Tags: orgviewidhttp地址wwwjobs模式
1条回答
网友
1楼 · 发布于 2024-09-30 18:23:06
^([A-Z][A-Za-z\s]*),\s+([A-Z]{2})\s+\d{5}$

我认为这足以让噪音远离。缺点是它可能会避免你想要的东西。在这种情况下,您可能希望使用像您的正则表达式这样的不太强的正则表达式来遍历页面。不管怎样,使用regex是不可能达到完美的。你知道吗

它与Javascript一起工作。调整语法以满足Python的需要。你知道吗

相关问题 更多 >