我是一个新的刮削和解析,我不知道该怎么办下一个问题。我需要从许多页面中删除电子邮件。For example
电子邮件所在的代码部分:
<tr><td>Email:</td><td width="10"></td><td><script>var ylhrfq = "ypr";var bdnd = "ail";var byil = "st.c";var bwdbdf = "age@";var dqiex = ".c";var pner = "om";var qkfow = "gm";var azzl = "ie";var hgcr = "n.pl";var link = byil + ylhrfq + azzl + hgcr + bwdbdf + qkfow + bdnd + dqiex + pner;var text = link;document.write('<a href="mailto:'+link+'" />'+text+'</a>');</script></td></tr>
有没有可能和BF一起抓到这封邮件?如果是,我怎么做?你知道吗
Win7,Python3,美女组
电子邮件地址似乎隐藏在原始的html中,并由javascript代码生成。有了
python2
,requests
,js2py
,BeautifulSoup4
,我终于得到了正确的电子邮件地址,希望这就是你想要的。你知道吗我分四步完成:
requests
获取网页的htmlBeautifulSoup4
解析html代码并获取用于生成电子邮件的javascript代码js2py
执行js代码并获得结果。你知道吗HTMLParser
对字符串进行转义你需要得到解析过的html。源本身只包含占位符和脚本。在PowerShell中,我会运行以下命令以获取电子邮件:
相关问题 更多 >
编程相关推荐