我有一个以下格式的大数据集:
id, socialmedia
1, facebook
2, facebook
3, google
4, google
5, google
6, twitter
7, google
8, twitter
9, snapchat
10, twitter
11, facebook
我想分组,然后分配一个group_id列,然后将其解组(展开)回单个记录。在
^{pr2}$我尝试了以下操作,但结果是“DataFrameGroupBy”对象不支持项分配。在
x['grpId'] = x.groupby('socialmedia')['socialmedia'].rank(method='dense').astype(int)
通过使用
ngroup
或}
^{pr2}$pd.factorize
和{您可以使用sklearn.preprocessing.LabelEncoder方法:
我们还可以创建一个字典并映射它:
退货
^{pr2}$或者像这样的一句话:
计时:
退货
相关问题 更多 >
编程相关推荐