如何使用多个正则表达式函数在python中提取数据

 title='École privée'/> 17 rue Jean Gallart 49650 ALLONNES #This is the address Téléphone : <a href="tel:0241528201">0241528201</a> #Phone no Adresse de courriel : <a href="mailto:ce.0491164Z@ac-nantes.fr">ce.0491164Z@ac-nantes.fr</a> # Email <a href="./etablissement/Allonnes/ECOLE-PRIMAIRE-PRIVEE-SAINT-DOUCELIN/0491164Z.html"> #Link for school

1条回答

网友

1楼 · 发布于 2024-06-23 20:09:16

这并不是完美的（链接模式是松散的），但它应该可以完成以下工作：

import re
full_string = """<br>title='École privée'/>
17 rue Jean Gallart  <br>49650 ALLONNES
<br>Téléphone : <a href="tel:0241528201">0241528201</a>
<br>Adresse de courriel : <a href="mailto:ce.0491164Z@ac-nantes.fr">ce.0491164Z@ac-nantes.fr</a>
<br><br><a href="./etablissement/Allonnes/ECOLE-PRIMAIRE-PRIVEE-SAINT-DOUCELIN/0491164Z.html">"""

addr_pattern = r'/>\s+(.*)?(?=\n<br>Téléphone)'
tel_pattern = r'<br>Téléphone.*?>(\d+)</a>'
mail_pattern = r'<br>Adresse de courriel.*?>(.*)?</a>'
link_pattern = r'<br><br><a href="(.*)?">'

print("Address: " + re.search(addr_pattern, full_string).group(1).replace('<br>', "").replace("  ", " "))
print("Telephone: " + re.search(tel_pattern, full_string).group(1))
print("Email: " + re.search(mail_pattern, full_string).group(1))
print("Link for school: " + re.search(link_pattern, full_string).group(1))

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何使用多个正则表达式函数在python中提取数据

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >