基于GA-d的Python序列模式挖掘

2024-10-03 21:24:27 发布

您现在位置:Python中文网/ 问答频道 /正文

我想检查一下用户一起访问过的最常见的页面。在GA中,pagePath和hitNumber确定页面顺序,并按fullvisitorId字段分组

在Python中,关联规则的数据准备是通过一个热编码完成的。然而,这样网页的序列就会丢失,这不是我想要的,这就是为什么我认为序列模式挖掘是一个很好的解决方案。但是,我不知道应该如何更改数据,这意味着pagePath中的值将出现在不同的列中,而不仅仅是一列中。在这一步之后,我也不知道如何实现序列模式挖掘算法。谁能帮帮我吗

多谢各位


Tags: 数据用户网页编码顺序规则模式序列