我有df:
domain orgid
csyunshu.com 108299
dshu.com 108299
bbbdshu.com 108299
cwakwakmrg.com 121303
ckonkatsunet.com 121303
我想添加一个新列,用每个orgid的数字id替换域列:
domain orgid domainid
csyunshu.com 108299 1
dshu.com 108299 2
bbbdshu.com 108299 3
cwakwakmrg.com 121303 1
ckonkatsunet.com 121303 2
我已经试过这一行了,但它没有给出我想要的结果:
df.groupby('orgid').count['domain'].reset_index()
有人能帮忙吗?
您可以使用sklearn.preprocessing中的LabelEncoder,例如:
您可以对
groupby
对象调用rank
,并传递参数method='first'
:如果要覆盖列,可以执行以下操作:
相关问题 更多 >
编程相关推荐