从给定的URL中提取电子邮件地址。

extract-emails的Python项目详细描述


从给定网站提取电子邮件

要求

  • 最小Python3.6
  • 请求
  • lxml

安装

pip install extract_emails

用法

from extract_emails import ExtractEmails

em = ExtractEmails(url, depth=None, print_log=False, ssl_verify=True, user_agent=None, request_delay=0.0)
emails = em.emails
  • url:str,例如:http://example.com
  • depth:int,扫描深度
  • print_log:布尔值,是否打印日志
  • ssl_verify:布尔型
  • 用户代理:str
  • 请求延迟:浮点

ssl\u verify-用于避免此类错误:*超过url: /API/v1/吊舱?watch=false(由sslerror引起(sslerror(1,“[ssl: 证书验证失败]证书验证失败 (_ssl.c:777)’)*

用户代理-您可以从几个用户代理中选择:iemsieoperachromegooglefirefoxsafarirandom

请求延迟-请求之间的时间延迟(秒)

return电子邮件列表。

更改日志

版本3.0.4

    Buf修复< /LI>

版本3.0.3

  • 改进解析器

版本3.0.1

  • 最低python版本:3.6
  • 删除假用户代理库
  • 改进电子邮件提取功能
  • 添加请求之间的时间延迟

版本2.0.0

  • 将beautifulsoup替换为lxml
  • 改进的电子邮件正则表达式
  • 添加了不同的用户代理

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java为引用变量指定默认值   java在2D数组中旋转innersquare   java将hashmap键值与int进行比较   java程序中的并发监视器陷入死锁   安卓 java。lang.NoClassDefFoundError:java。awt。光标   java有没有更好的方法来引用包含对象的对象?   如何在Java编程中循环代码块   java如何在Junit5中使用Serenity?   java使用ANTLR识别JavaScript文件中的全局变量声明   EJB查询对象生成的java视图SQL?   java查找股票报价的范围   java错误:(453,69)不允许使用字符串类型(在值为“”的“活动\u水平\u边距”处)   java安装的环境变量   amazon web服务在使用awssdkjava上载到S3存储桶时发生直接错误   java在Android的ArrayList中添加相等的值   尝试打开MyEclipse Enterprise Workbench时出现ide“无法创建java虚拟机”错误   java如何使用单元格指定的行和列更改jTable的单元格颜色?   java如何等待文件从系统目录复制到具有根访问权限的外部存储