我有一个如下的数据集:
user ID cat1 cat2 views
12345 1 A B 1
67890 2 D F 1
12345 2 D F 1
34567 3 E F 2
67890 3 E F 1
等等
基本上,每个ID都有一个唯一的类别/标记数。因此,如果您看到,用户的ID 2和3在查看时具有相同的标记
我想把它转换成:
user cat1_A cat1_D cat1E.... cat2_B cat2_F.....
12345 1 1 0 1 1
67890 0 1 1 0 2
34567 0 0 2 0 2
等等
基本上用他们拥有的视图对类别进行编码。请帮忙
我只能想到用for循环拆分它,然后用
pivot
逐个执行concat
用
pd.get_dummies
然后multiply
和groupby
输出:
IIUC公司:
然后是客房部
如果你喜欢的话,可以合并等级
相关问题 更多 >
编程相关推荐