selenium python:如何找到网页上的每封电子邮件?

2024-09-24 22:18:07 发布

您现在位置:Python中文网/ 问答频道 /正文

该网站不显示电子邮件地址作为文本,有按钮打开一个电子邮件框,但电子邮件地址显示在源代码中。在

每封电子邮件都是这种类型的html代码:

<a onclick="CC('palthoff@mcpaz.com', '', '','','');" href="#"><img src="/cpd/images/icons/email_yellow_sm.gif" border="0"></a>

我可以通过xpath找到元素:

^{pr2}$

但当我“打印”时电子邮件.text“什么也没出现。我知道只有在页面上显示文本时,它才会打印文本,但是我怎么才能打印“onclick”中显示的电子邮件地址呢?onclick=“CC('电子邮件地址)'

我想从这个网站抓取每个电子邮件地址,但我不知道如何打印这些文本。在

非常感谢你的帮助。抱歉,如果这是基本的,我已经在谷歌搜索我的问题,找不到我要找的。在


Tags: 代码文本com类型源代码网站电子邮件地址
2条回答

我想出来了。在

代码如下:

emails = browser.find_elements_by_tag_name("a")

for x in range(0,len(emails)):
    code = emails[x].get_attribute("outerHTML")
    print code

但它打印完整的外部HTML。有什么方法可以分析指纹吗?在

^{pr2}$

除去邮件以外的一切?在

要打印电子邮件文本,您可以将get_attribute方法返回的字符串切片到您自己的答案中:

emails = browser.find_elements_by_tag_name("a")

for x in range(0,len(emails)):
    code = emails[x].get_attribute("onclick")
    email = code[4:len(code)-17]
    print email

相关问题 更多 >