Python Pandas：如何分组并为组中的所有项分配id？

2条回答

网友

1楼 · 编辑于 2024-06-26 14:02:52

您可以使用sklearn.preprocessing中的LabelEncoder，例如：

df["domain"] = LabelEncoder().fit_transform(df.domain)

网友

2楼 · 编辑于 2024-06-26 14:02:52

您可以对groupby对象调用rank，并传递参数method='first'：

In [61]:
df['domainId'] = df.groupby('orgid')['orgid'].rank(method='first')
df

Out[61]:
             domain   orgid  domainId
0      csyunshu.com  108299         1
1          dshu.com  108299         2
2       bbbdshu.com  108299         3
3    cwakwakmrg.com  121303         1
4  ckonkatsunet.com  121303         2

如果要覆盖列，可以执行以下操作：

df['domain'] = df.groupby('orgid')['orgid'].rank(method='first')

编程相关推荐

java如何从用户输入中找到最大值和最小值？（while循环）
java数据库资源异常
java hibernate查询速度太慢，是否忽略了延迟加载条件？
不带花括号的java IfElse控制流
nextInt（）中十进制数输入的java检查
java根据REST中的资源类型发送不同的响应主体
JAVAutil。扫描器Java系统。争论中
对于单个条目，java XSLT到数组的转换失败
java将txt文档预处理为以字符串为键、整数ArrayList为值的hashmap
java获取泛型数组类类型的简单方法？

相关问题更多 >

编程相关推荐

热门问题

热门文章

Python Pandas：如何分组并为组中的所有项分配id？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >