基于redis的朴素贝叶斯文本分类器

redisbayes的Python项目详细描述


name:redisbayes
description:Naïve Bayesian Text Classifier on Redis
Copyright:© 2012 Justine Alexandra Roberts Tunney
license:MIT

这是什么?

是垃圾邮件过滤器。我写这篇文章是为了过滤来自高层的垃圾评论 流量论坛网站和它工作得很好。它也可以为你工作:) 它不与任何特定格式(如电子邮件)绑定,只处理原始的 文本。

这可能是您为python找到的唯一一个垃圾邮件过滤库 简单的(170行代码),有效的(30行测试代码),并不糟糕。

安装

从文件夹:

sudo python setup.py install

来自芝士店:

sudo pip install redisbayes

来自Git:

sudo pip install git+git://github.com/jart/redisbayes.git

基本用法

import redis, redisbayes
rb = redisbayes.RedisBayes(redis=redis.Redis())

rb.train('good', 'sunshine drugs love sex lobster sloth')
rb.train('bad', 'fear death horror government zombie god')

assert rb.classify('sloths are so cute i love them') == 'good'
assert rb.classify('i fear god and love the government') == 'bad'

print rb.score('i fear god and love the government')

rb.untrain('good', 'sunshine drugs love sex lobster sloth')
rb.untrain('bad', 'fear death horror government zombie god')

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java类。getConstructor找不到兼容的构造函数   java单元测试自定义输入和输出格式   javascript Java UI线程内存不足错误被阻止   多线程在Java并发API中从线程池中选择线程的逻辑是什么?   java在MySQL数据库上存储歌曲(BLOb支持)   java快速且可扩展的IO传递   jsf c:forEach-inside-primeface(例如p:panelgrid)inside-ui:repeat   tomcat与JavaServlet3.0文件上传,如何获取maxfilesize值   java JNI,加载2次相同的dll(不同的名称),如何选择使用哪一个?   java将InputStream复制到OutputStream将停止,除非我也向系统写入。出来   java Set反向安全约束   比如在java中使用整数时?   java使用@接口抑制IntelliJ中的某些警告   java我的ASCII艺术在JLabel上是错误的   JavaSpring工具源代码(或带有SpringIde的Eclipse)崩溃   向片段添加ListView时出现java错误   循环Java循环错误需要重新审视   JavaAspectJ:匹配GenericServlet。带注释子类实例的init()调用