我是Python新手,为了从各种网页中查找和打印电子邮件地址,我编写了以下测试代码以供练习:
def FindEmails(*urls):
for i in urls:
totalemails = []
req = urllib2.Request(i)
aResp = urllib2.urlopen(req)
webpage = aResp.read()
patt1 = '(\w+[-\w]\w+@\w+[.]\w+[.\w+]\w+)'
patt2 = '(\w+[\w]\w+@\w+[.]\w+)'
regexlist = [patt1,patt2]
for regex in regexlist:
match = re.search(regex,webpage)
if match:
totalemails.append(match.group())
break
#return totalemails
print "Mails from webpages are: %s " % totalemails
if __name__== "__main__":
FindEmails('https://www.urltest1.com', 'https://www.urltest2.com')
当我运行它时,它只打印一个参数。 我的目标是打印从网页获取的电子邮件,并将它们存储在列表中,用逗号分隔。你知道吗
提前谢谢。你知道吗
这里的问题是:
totalemails = []
。在这里,您将重新实例化变量totalemails
,使其具有零个条目。因此,在每个迭代中,它只有一个条目。在最后一次迭代之后,您将只得到列表中的最后一个条目。要获得所有电子邮件的列表,需要将变量置于for
循环之外。 示例:相关问题 更多 >
编程相关推荐