从给定的URL中提取电子邮件地址。
extract-emails的Python项目详细描述
从给定网站提取电子邮件
要求
- 最小Python3.6
- 请求
- lxml
安装
pip install extract_emails
用法
from extract_emails import ExtractEmails em = ExtractEmails(url, depth=None, print_log=False, ssl_verify=True, user_agent=None, request_delay=0.0) emails = em.emails
- url:str,例如:http://example.com
- depth:int,扫描深度
- print_log:布尔值,是否打印日志
- ssl_verify:布尔型
- 用户代理:str
- 请求延迟:浮点
ssl\u verify-用于避免此类错误:*超过url: /API/v1/吊舱?watch=false(由sslerror引起(sslerror(1,“[ssl: 证书验证失败]证书验证失败 (_ssl.c:777)’)*
用户代理-您可以从几个用户代理中选择:ie,msie, opera,chrome,google,firefox,safari或random
请求延迟-请求之间的时间延迟(秒)
return电子邮件列表。
更改日志
版本3.0.4
-
Buf修复< /LI>
版本3.0.3
- 改进解析器
版本3.0.1
- 最低python版本:3.6
- 删除假用户代理库
- 改进电子邮件提取功能
- 添加请求之间的时间延迟
版本2.0.0
- 将beautifulsoup替换为lxml
- 改进的电子邮件正则表达式
- 添加了不同的用户代理