自动工具,用于删除工作公告。
JobFunnel的Python项目详细描述
自动工具,用于将工作公告刮入.csv
文件。在
求职网站的好处:
- 同一份工作永远见不到两次!在
- 没有广告。在
- 在一个地方查看多个求职网站上的工作。在
安装
JobFunnel需要Python3.8或更高版本。
pip install git+https://github.com/PaulMcInnis/JobFunnel.git
使用
通过定期的剪贴和复习,你甚至可以消除最繁忙的就业市场的噪音。在
配置
可以使用YAML配置文件或通过传递命令参数来搜索作业。在
通过运行以下命令下载演示settings.yaml:
^{pr2}$注意:
- 在
建议提供尽可能少的搜索关键字(即
在Python
,AI
)。 - 在
JobFunnel当前仅支持
在CANADA_ENGLISH
和{}区域设置。
刮擦
使用设置YAML运行funnel
,用可用提供程序中的作业填充主CSV文件:
funnel load -s my_settings.yaml
复习
打开主CSV文件并更新每个作业status
:
- 在
设置为
在interested
、applied
、interview
或{},以反映您在作业中的进展情况。在 - 在
设置为
在archive
、rejected
或delete
以从此搜索中删除作业。您可以在您的block_list_file
中查看“阻止”的作业。在
高级用法
- 在
自动搜索
在
使用crontab
有关详细信息,请参阅crontab document。在 - 在
编写自己的scraper
在
如果你有一个工作网站,你想写一个scraper,欢迎你实现它,查看Base Scraper的实现细节。在 - 在
远程工作
在
通过设置搜索参数remoteness
来匹配您想要的级别,即FULLY_REMOTE
,绕过寻找远程工作的令人沮丧的用户体验。在 - 在
添加对X语言/工作网站的支持
在
JobFunnel支持跨区域和域从同一个工作网站上抓取作业。如果您对添加支持感兴趣,您可能只需要定义会话头和域字符串,请查看Base Scraper以获取进一步的实现详细信息。在 - 在
封锁公司
在
通过将不需要的公司添加到YAML中的company_block_list
中,或通过命令行将它们作为-cbl
传递,从而过滤出不需要的公司。在 - 在
Job Age Filter
在
您可以通过配置max_listing_days
来配置已刮取列表的最长期限(以天为单位)。在 - 在
查看终端中的作业
您可以在命令行中查看作业列表:
在column -s, -t < master_list.csv | less -#2 -N -S
- 在
尊重延迟
我们内置的延迟算法,恭敬地为您的工作岗位擦伤。在为了更好地理解如何配置延迟,请查看this Jupyter Notebook,它通过代码和可视化逐步分解算法。在
在 - 在
恢复丢失的数据
JobFunnel可以从您的cache_folder
重新构建主CSV,其中所有历史刮擦数据都位于:
在funnel --recover
- 在
通过CLI运行
只能使用CLI运行JobFunnel,请通过以下方式查看命令结构:
在funnel inline -h
- 项目
标签: