df1 = pd.DataFrame(pd.factorize(df.values.ravel())[0].reshape(df.shape))
df1.columns = ['ID{}'.format(x+1) for x in range(len(df1.columns))]
print (df1)
ID1 ID2
0 0 1
1 0 2
2 1 3
3 2 4
4 3 4
df = df.join(df1)
print (df)
Name1 Name2 ID1 ID2
0 John Jack 0 1
1 John Albert 0 2
2 Jack Eva 1 3
3 Albert Sara 2 4
4 Eva Sara 3 4
创建MultiIndex Seriesby ^{},创建ids by ^{}和for DataFrame^{},然后rename列并通过^{}添加到原始列:
s = df.stack()
df = df.join(pd.Series(pd.factorize(s)[0], index=s.index)
.unstack()
.rename(columns=lambda x: x.replace('Name','ID')))
print (df)
Name1 Name2 ID1 ID2
0 John Jack 0 1
1 John Albert 0 2
2 Jack Eva 1 3
3 Albert Sara 2 4
4 Eva Sara 3 4
类似替代方案:
s = df.stack()
s[:] = pd.factorize(s)[0]
df = df.join(s.unstack().rename(columns=lambda x: x.replace('Name','ID')))
print (df)
Name1 Name2 ID1 ID2
0 John Jack 0 1
1 John Albert 0 2
2 Jack Eva 1 3
3 Albert Sara 2 4
4 Eva Sara 3 4
如果哪个名字得到哪个号码并不重要,你也可以考虑
产生
首先按^{} 展平值并按原始
df
重塑形状,使用数据帧构造函数并创建列名,最后按原始join
:创建} ,创建} 和for } ,然后} 添加到原始列:
MultiIndex Series
by ^{id
s by ^{DataFrame
^{rename
列并通过^{类似替代方案:
相关问题 更多 >
编程相关推荐