基于数据帧中的一对列从辅助表中查找交点的最有效方法是什么？

UserItem_df = pd.DataFrame({'user': ['A', 'B', 'B'] , 'item': ['i', 'j', 'k']}) UserTag_df = pd.DataFrame({'user': ['A', 'B'] , 'tag' : ['T', 'R']}) ItemTag_df = pd.DataFrame({'item': ['i', 'j', 'k', 'k'] , 'tag' : ['T', 'S', 'T', 'R']})

1条回答

网友

1楼 · 发布于 2024-10-03 21:27:47

使用：

# step 1:
df1 = pd.merge(UserItem_df, UserTag_df, on='user')

# step 2:
df2 = pd.merge(UserItem_df, ItemTag_df, on='item')

# step 3
df3 = pd.concat([df1, df2], ignore_index=True)

# step 4
df3 = (
    df3.groupby(['user', 'item'])['tag']
    .agg(intersection='count', union='nunique')
    .reset_index()
)
df3['intersection'] -= df3['union']

步骤：

# step 1: df1
  user item tag
0    A    i   T
1    B    j   R
2    B    k   R

# step 2: df2
  user item tag
0    A    i   T
1    B    j   S
2    B    k   T
3    B    k   R

# step 3: df3
  user item tag
0    A    i   T
1    B    j   R
2    B    k   R
3    A    i   T
4    B    j   S
5    B    k   T
6    B    k   R

# step 4: df3
  user item  intersection  union
0    A    i             1      1
1    B    j             0      2
2    B    k             1      2

相关问题更多 >

编程相关推荐

热门问题

热门文章

基于数据帧中的一对列从辅助表中查找交点的最有效方法是什么？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >