在带有bs4的python中使用regex从脚本中刮取电子邮件地址

2条回答

网友

1楼 · 编辑于 2024-09-30 12:25:22

似乎您没有使用正确的findall方法。您需要import re，然后使用^{}方法，而不是findAll()方法（注意字母“A”的大小写差异）。函数的接口是：

re.findall(pattern, string, flags=0)

有关详细信息，请参见re文档中的this section查找所有副词。你知道吗

网友

2楼 · 编辑于 2024-09-30 12:25:22

尽管regex可能会随着时间的推移而变得更加健壮，但根据我的经验，脚本标签的这些部分保持相当稳定，所以考虑使用split的计划B

html ='''

<script>EMLink('com','aol','mikemhnam','<div class="emailgraphic"><img style="position: relative; top: 3px;" src="https://www.naylornetwork.com/EMailProtector/text-gif.aspx?sx=com&nx=mikemhnam&dx=aol&size=9&color=034af3&underline=yes" border=0></div>','pcoc.officialbuyersguide.net Inquiry','onClick=\'$.get("TrackLinkClick", { LinkType: "Email", LinkValue: "mikemhnam@aol.com", MDSID: "CPC-1210", AdListingID: "" });\'')</script>
<br/>

'''

print(html.split('LinkValue: "')[1].split('"')[0])

相关问题更多 >

编程相关推荐

热门问题

热门文章

在带有bs4的python中使用regex从脚本中刮取电子邮件地址

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >