有多少独特的用户购买了产品?

2024-05-11 09:16:24 发布

您现在位置:Python中文网/ 问答频道 /正文

我有这样一个数据集

users                                     b           c       d      product
8fa683e59c02c04cb781ac689686db07    ggstart 1.46276E+12 00:00.0 55107008    
335644267c1d5f04eaea7bc6f51b1861    ggstart 1.46276E+12 00:00.0 55107008    
ca3071aad676bc963795a2b09635cdf0    ggstop  1.46277E+12 00:00.0 55107008    
17412dec7d3d02c9b0b1c3d1c3571c5c    ggstop  1.46276E+12 00:00.0 10655437    
f81167c854f1a0c86cab6188f9995824    ggstart 1.46276E+12 00:00.1 55107008    
17412dec7d3d02c9b0b1c3d1c3571c5c    ggstart 1.46276E+12 00:00.1 10655437    
a2659df45c8d05f326225fa5b1063ac9    ggstart 1.46276E+12 00:00.1 30900473    
b8bbef76f8dfee2fe190a283cd5a19a7    ggstart 1.46276E+12 00:00.1 18121481    
e8ebfc3f39512eda3aa0702b13ffed63    ggstart 1.46276E+12 00:00.1 18121481    
988e4873861347113519fbee6dd1c3b0    ggstart 1.46276E+12 00:00.2 55107008    
583361d66ad8b0827cd08d3a5d64af89    ggstop  1.46276E+12 00:00.2 55107008    

users、b、c和product是列

我必须确定每个产品是由多少独特的用户购买的。像这样的台词有成千上万条。 请记住:

there can be many users buying the same product,
each customer have more than one product bought

首先,我试图建立一个独特用户和独特产品的矩阵。但我只有16个产品,用户大约5000人。 我能找到什么办法吗


Tags: 数据用户产品productcanusersthere台词