自动工具,用于删除工作公告。

JobFunnel的Python项目详细描述


JobFunnel Banner
Build StatusCode Coverage

自动工具,用于将工作公告刮入.csv文件。在

求职网站的好处:

  • 同一份工作永远见不到两次!在
  • 没有广告。在
  • 在一个地方查看多个求职网站上的工作。在

masterlist.csv

安装

JobFunnel需要Python3.8或更高版本。

pip install git+https://github.com/PaulMcInnis/JobFunnel.git

使用

通过定期的剪贴和复习,你甚至可以消除最繁忙的就业市场的噪音。在

配置

可以使用YAML配置文件或通过传递命令参数来搜索作业。在

通过运行以下命令下载演示settings.yaml

^{pr2}$

注意:

  • 建议提供尽可能少的搜索关键字(即PythonAI)。

  • JobFunnel当前仅支持CANADA_ENGLISH和{}区域设置。

刮擦

使用设置YAML运行funnel,用可用提供程序中的作业填充主CSV文件:

funnel load -s my_settings.yaml

复习

打开主CSV文件并更新每个作业status

  • 设置为interestedappliedinterview或{},以反映您在作业中的进展情况。在

  • 设置为archiverejecteddelete以从此搜索中删除作业。您可以在您的block_list_file中查看“阻止”的作业。在

高级用法

  • 自动搜索
    使用crontab
    有关详细信息,请参阅crontab document。在

  • 编写自己的scraper
    如果你有一个工作网站,你想写一个scraper,欢迎你实现它,查看Base Scraper的实现细节。在

  • 远程工作
    通过设置搜索参数remoteness来匹配您想要的级别,即FULLY_REMOTE,绕过寻找远程工作的令人沮丧的用户体验。在

  • 添加对X语言/工作网站的支持
    JobFunnel支持跨区域和域从同一个工作网站上抓取作业。如果您对添加支持感兴趣,您可能只需要定义会话头和域字符串,请查看Base Scraper以获取进一步的实现详细信息。在

  • 封锁公司
    通过将不需要的公司添加到YAML中的company_block_list中,或通过命令行将它们作为-cbl传递,从而过滤出不需要的公司。在

  • Job Age Filter
    您可以通过配置max_listing_days来配置已刮取列表的最长期限(以天为单位)。在

  • 查看终端中的作业
    您可以在命令行中查看作业列表:

    column -s, -t < master_list.csv | less -#2 -N -S
    
  • 尊重延迟
    我们内置的延迟算法,恭敬地为您的工作岗位擦伤。在

    为了更好地理解如何配置延迟,请查看this Jupyter Notebook,它通过代码和可视化逐步分解算法。在

  • 恢复丢失的数据
    JobFunnel可以从您的cache_folder重新构建主CSV,其中所有历史刮擦数据都位于:

    funnel --recover
    
  • 通过CLI运行
    只能使用CLI运行JobFunnel,请通过以下方式查看命令结构:

    funnel inline -h
    

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java我能知道文件的哪个条目正在被修改吗?   多线程Java并发线程   java抓取包含多个页面的多个字母标签的网站   为什么if语句不排除Java中的另一个if语句?   Java可序列化哈希映射到ByteArray以创建blob   JavaEclipseLombokBuilder添加新建议   java将文件路径数组转换为文件数组,并计算每个文件的大小   在Java8流中添加大小数   Bouncy Castle 1.46之前版本的java兼容性问题   无法在AWS设备场上运行安卓 Java Appium测试   java为什么不使用mavenwarplugin将键与“WEBINF/classes/METAINF/MANIFEST.MF”合并?   java如何在引用子类的成员时调用super()   找不到java TestFx无头MonoclePlatformFactory   java AbstractMethodError onClientSessionEvent和“缺少控制媒体的权限”   正则表达式如何使用JAVA在字符串的大写字母前插入空格?   我的Spring安全项目中的java BCrypt(Spring安全)   java在我的网站上查看小程序更新时遇到问题   java如何使用schedule方法