文档相似性服务器

simserver的Python项目详细描述


索引纯文本文档并查询语义相关文档的索引。

simserver在内部使用事务来提供一个健壮且可伸缩的相似性服务器。

安装

simserver构建在 主题建模。

安装simserver的简单方法是使用:

sudo easy_install -U simserver

或者,如果您下载并解压缩了source tar.gz包, 您需要运行:

python setup.py test
sudo python setup.py install

这个版本已经在Python2.5和2.7下测试过,但是应该在任何2.5<;=Python<;3.0上运行。

文档

http://radimrehurek.com/gensim/simserver.html。很快就会有更多。

许可

simserver在GNU Affero GPL license v3下发布。

这意味着您可以在应用程序(甚至是商业应用程序)中自由使用simserver。我是说, 但是您必须在agpl兼容许可证下打开应用程序的源代码

agpl许可证确保即使在您提出申请时也适用 仅远程可用(例如通过网络)。

tl;dr:simserver是开源的,但您必须与我联系以获得任何专有用途。

历史记录

0.1.4:
  • 分片的性能改进
  • 更改为线程模型–取消了对每个线程会话访问的限制
  • 在index optmize()中修复错误
0.1.3:
  • 很少培训文档的行为改变:使用更简单的日志熵模型,而不是潜在的语义分析
  • 修复了泄漏sqlite文件描述符的错误

版权所有(c)2011 Radim Rehurek

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
请求响应模式的java JMS   java如何从SeleniumWebDriver中的“Span Type下拉列表”中选择值   java JPA相当于Hibernate的@Generated(GenerationTime.ALWAYS)   java ActiveMQ查询:如何启动   java如何在jsp文件中使用freemarker标记库?   java如何在TabsLayout中用另一个片段替换一个片段的内容?   国际化如何理解Java教程国际化定制资源包加载示例?   XML配置中的java spring log4j无法为日志信息创建文件   oracle11g JDK 6:有没有办法运行一个新的java进程来执行指定类的主方法   java在avro模式中使用“default”   缺陷跟踪我在哪里可以提交关于FOSS Java Sound实施组织的缺陷报告。类路径。冰岛。pulseaudio。Pulseaudiosourcedaline?   编码Java系统。在和系统中。Sun/Oracle和IBM JVM解决方案在读写标准字节数组方面存在差异   java如何将列表项作为查询参数添加到字符串url中?   将自定义库导出到可导入jar文件java