Python数据帧：同一列上的轴

df = pd.DataFrame(np.array([['111', 'AAA'],['222','AAA'],['333','BBB'],['444','CCC'],['444','AAA'],['222','BBB'],['111','BBB']]),columns=['ID','division']) ID division 0 111 AAA 1 222 AAA 2 333 BBB 3 444 CCC 4 444 AAA 5 222 BBB 6 111 BBB

if df = pd.DataFrame(np.array([['111', 'AAA','4'],['222','AAA','5'],['333','BBB','6'], ['444','CCC','3'],['444','AAA','2'], ['222','BBB','2'], ['111','BBB','7']]),columns=['ID','division','count']) ID division count 0 111 AAA 4 1 222 AAA 5 2 333 BBB 6 3 444 CCC 3 4 444 AAA 2 5 222 BBB 2 6 111 BBB 7

df_result = pd.DataFrame(np.array([['0','18','13','6'],['18','0','8','7'],['13','8','0','0'],['6','7','0','0']]),columns=['111','222','333','444'],index=['111','222','333','444']) 111 222 333 444 111 0 18 13 6 222 18 0 8 7 333 13 8 0 0 444 6 7 0 0

1条回答

网友

1楼 · 发布于 2024-09-29 09:37:27

另一种方法是使用带有merge和pd.crosstab的自连接：

df_out = df.merge(df, on='division')

results = pd.crosstab(df_out.ID_x, df_out.ID_y) 
np.fill_diagonal(results.values, 0)

输出：

^{pr2}$

案例2

df = pd.DataFrame(np.array([['111', 'AAA','4'],['222','AAA','5'],['333','BBB','6'],
                            ['444','CCC','3'],['444','AAA','2'], ['222','BBB','2'],
                            ['111','BBB','7']]),columns=['ID','division','count'])

df['count'] = df['count'].astype(int)
df_out = df.merge(df, on='division')

df_out = df_out.assign(count = df_out.count_x + df_out.count_y)

results = pd.crosstab(df_out.ID_x, df_out.ID_y, df_out['count'], aggfunc='sum').fillna(0) 
np.fill_diagonal(results.values, 0)

输出：

ID_y   111   222   333  444
ID_x                       
111    0.0  18.0  13.0  6.0
222   18.0   0.0   8.0  7.0
333   13.0   8.0   0.0  0.0
444    6.0   7.0   0.0  0.0

案例2

相关问题更多 >

编程相关推荐

热门问题

热门文章