有 Java 编程相关的问题?

你可以在下面搜索框中键入要查询的问题!

使用Solr和Mahout的java推荐系统

我一直在读关于使用Solr和Mahout开发推荐系统的书

据我所知,他们处理两个不同的问题

  1. 由于Solr是一个搜索引擎+分类系统,它主要用于“更像这样”的推荐 在Drupal中-http://jamidwyer.com/d7/node/21

(或StackOverflow中的“相关”功能)

  1. 在Mahout的例子中,它实现了机器学习算法,比如协同过滤。它可以用来 根据用户以前的操作在Amazon中实现建议等功能。(喜欢,买的东西)

我的问题,

它们是否用于解决两个不同的问题

它们可以整合吗

我读到Mahout做离线处理和可扩展。这是否意味着Solr无法缩放


共 (3) 个答案

  1. # 1 楼答案

    你说得对,它们解决了两个不同的问题,到目前为止,我还没有看到/发现任何现成的集成

    您可以做的是使用Mahout分类结果向索引文档中添加更多信息,这些信息可以用于增强目的

    关于你的最后一个答案-Solr可以扩展,在刚刚发布的4.0版本中,它甚至可以比以前扩展得更好。但它解决了一个不同的目的,并且可以很好地扩展

    你的问题有点不具体,所以我希望这能在某种程度上有所帮助

    干杯

  2. # 2 楼答案

    这些是针对不同问题的不同工具。Solr并没有真正提出建议,而是根据内容建议类似的文档。这不是个性化的,因为它与用户无关。它非常擅长这个具体问题

    Taste/Mahout用于协同过滤,它不是特定于文档或任何其他类型的东西,在“相似项目”和建议方面有着关键的不同,它们基于用户项目交互,而不是项目属性

    根据你的需要和意思,两者都能很好地扩展。没有理由怀疑索尔

    关于收银员和推荐人,简而言之,它有两个部分。One piece(Taste)是实时的,不基于Hadoop,可以在一台机器上扩展到中等数据集(可能是1000万个数据点)。然后,Mahout添加了一个基于Hadoop的、非实时的、可扩展的批处理实现。(广告:我是上述文章的主要作者,目前正在开发一个基于这两个版本的下一代系统,名为Myrrix。如果您对可伸缩和实时的Mahout风格的推荐程序都感兴趣,这将很有吸引力。)

    如果你对一家公司有兴趣建立一个基于上述内容的平台,包括Solr,你应该看看NGDATA

  3. # 3 楼答案

    如果你想弄脏你的手,你可以使用Solr+协同过滤来创建一个真正的搜索感知推荐系统。也就是说,给定一个搜索S和给定搜索者的购买历史P_i以及给定其他所有人的购买历史P_j,其中j≠i。然后,您可以返回满足搜索S的结果,但这些结果是基于搜索者可能希望基于其他类似用户的项目而增强的

    下面是我写的一篇博客文章,可以为你指出正确的方向:http://opensourceconnections.com/blog/2013/10/05/search-aware-product-recommendation-in-solr/