用于opentc的icap服务器(使用机器学习的文本分类引擎)
opentc-icap的Python项目详细描述
因特网内容适配协议(ICAP)是一种轻量级协议 rfc 3507中指定的类http协议,用于扩展 透明代理服务器。通常用于病毒扫描或 内容过滤
这个icap服务器opentc的目的是演示 OpenTC服务器的用法在这种情况下,icap服务器用作 数据泄漏预防(DLP)它正在侦听icap服务器的默认值 端口1344。squid缓存用作http/s代理(它也可以 任何其他代理服务器)它被配置为连接到icap服务器 用于内容筛选任何通过squid的向外http流量 代理将被发送到icap服务器,然后该服务器将其转发到 OpenTC服务器。opentc服务器分析数据并基于 预先训练的数据文本分类的结果被发回 发送到icap服务器,该服务器将决定传出流量是否应为 被阻止或允许。
要求
- python 3.x
- 开放式TC
- 皮亚姆
- 皮卡普1.0b1
- python魔术
- python多部分
待办事项
- icap服务器应该监视OpenTC服务器的可用性。 如果它没有启动或运行,这个icap服务器应该尝试 以不同的间隔重新连接几次(即 前3次重连的间隔可能是10秒,3次后 尝试重新连接失败,间隔连接时间 应该改为300秒)目前,icap服务器必须 在opentc服务器死机或重新启动后手动重新启动。
- 目前的决定,要么是交通堵塞,要么是 允许,使用手动“for_loop-if-elif”序列实现, 可能不容易理解或容易出错在未来 软件将使用规则引擎(如果有的话)来简化 创建复杂规则。