用于项集挖掘算法的python包。
itemset-mining的Python项目详细描述
项集挖掘
在 在
在 在
实现项集挖掘算法。在
算法
高效用项目集挖掘(HUIM)
HUIM通过考虑项目值和权重来推广频繁项集挖掘问题。HUIM的一个流行应用是发现客户一起购买的所有商品集,这些商品为零售商带来高利润。在这种情况下,项目值不仅显示篮子中有一车面包,而且还显示有多少面包;重量将包括一条面包的利润。在
更严格地说,HUIM要求事务“数据库”中的事务具有与每个事务中的每个项相关联的内部实用程序(即项值),以及每个项的外部实用程序的“数据库”(即权重)。在
Algorithm | Class | How to Cite |
---|---|---|
Two-Phase* | itemset_mining.two_phase_huim.TwoPhase | Link |
*包括最大长度支撑
路线图(从高到低优先级):
- 使用bond、all confidence或affinity中的一个来处理低相关性的hui。效用很高的项集,但如果这些项之间没有关联,则可能会误导做出营销决策。E、 如果一台电视机和一支笔组成的物品集是回族,那很可能只是因为电视机很贵,而不是因为它是一种有趣的图案。在
- Addaverage实用工具度量支持,实现更简单、更直观的分钟数
- 通过折扣策略表和升级的外部实用程序表支持折扣策略。在
- 添加top-k HUI支持。
- 支持识别周期性高效用项目集。这允许检测高效用项目集之间的购买模式,从而允许向定期购买项目集的客户进行交叉促销。在
- Support items'on shelf time.忽略货架时间将偏向于货架时间较长的项目,因为它们更有机会产生更高的效用。在
- 允许增量事务更新,而无需重新运行所有内容。在
- 支持简洁的HUI项集,特别是封闭形式。这使得算法更加高效,只显示更长的项集,这可能是最有趣的项集(相关性问题除外)。在
安装:
pip install itemset-mining
示例:
^{pr2}$- 项目
标签: