java推特价值预测:什么样的分析(贝叶斯?)可能会预测推特用户对推特的重视程度?
我正在考虑向TalkingPuffinTwitter客户端添加一个功能,在与用户进行一些培训后,它可以根据预测值对传入的推文进行排序。Java虚拟机(Scala或Java首选)有什么解决方案来做这类事情
你可以在下面搜索框中键入要查询的问题!
我正在考虑向TalkingPuffinTwitter客户端添加一个功能,在与用户进行一些培训后,它可以根据预测值对传入的推文进行排序。Java虚拟机(Scala或Java首选)有什么解决方案来做这类事情
# 1 楼答案
做好这件事并不容易。谷歌希望能够做到这一点(“用户会重视哪些链接”),Netflix(“他们会重视哪些电影”)和其他许多公司也是如此。事实上,你最好通读一下关于winning entry for the Netflix Prize的注释
然后,您需要提取一组特性,正如@hmason所说的。然后你需要一个合适的机器学习算法;你要么需要一个函数逼近器(在这里你尝试使用你的功能来预测一个介于0和1之间的值,其中1是“有史以来最好的tweet”,0是“omg谁在乎”),要么需要一个分类器(在这里你使用你的功能来尝试预测它是“好”还是“坏”tweet)
如果你选择后者,这使得用户培训变得容易,因为他们只需要用“喜欢”(混合社交网络隐喻)来评分推特,那么你通常最好使用支持向量机,因为支持向量机存在一个fairly comprehensive Java library
在前一种情况下,有多种技术可能值得尝试;如果您决定使用LIBSVM库,它们也有用于回归(即参数估计)的变量
# 2 楼答案
这是一个分类问题,本质上你想学习一个函数y(x),它预测“x”,一个未标记的tweet,是属于“有价值”类还是属于“无价值”类
这里最棘手的不是算法(朴素贝叶斯只是计数和乘法,很容易编码!)但是:
首先,我建议您跟踪用户喜爱、回复和转发的推文,其次,查看推文的作者、推文中的文字以及是否包含链接等质量