Pandas随机ID类别

import pandas as pd import random import string df1 = pd.DataFrame({'Name': ['John', 'Susie', 'Jack', 'Jill', 'John']}) df1['id'] = df1.groupby('Name').ngroup() df1['idz'] = df1['Name'].astype('category').cat.codes Name id idz 0 John 2 2 1 Susie 3 3 2 Jack 0 0 3 Jill 1 1 4 John 2 2

2条回答

网友
1楼 · 编辑于 2024-09-29 01:30:23

gourpby+transform
df1['random id'] = df1.groupby('idz').idz.transform(lambda x : id_generator(3)) df1 Out[657]: Name id idz random id 0 John 2 2 35P 1 Susie 3 3 6UU 2 Jack 0 0 XGF 3 Jill 1 1 5LC 4 John 2 2 35P

网友
2楼 · 编辑于 2024-09-29 01:30:23

在前面加上“这可能不是最有效的选择”。在
我将通过首先找到每个唯一用户来为每个唯一用户生成随机ID。在
# Finding unique users and storing in a new DataFrame df_unique_users = pd.DataFrame({'Name':[x for x in set(df['Name'])]}) # Generating unique user ID's for length of data frame # By using a set you are guaranteed unique values. You just need to make sure # you have enough permutations of the unique random_id so that your rand_set # will eventually be longer than your unique Names DataFrame. rand_set = set() while(len(rand_set)<len(df_unique_users)): rand_set = rand_set.union([id_generator(3)]) df_unique_users['Rand_ID'] = rand_set ### Mapping the random ID's over to the original DataFrame df = df.merge(df_unique_users, how='left', left_on='Name', right_on='Name')
类似地，您可以使用原始ID列而不是Name列来获取唯一值。在

相关问题更多 >

编程相关推荐

热门问题

热门文章