创建一个数据帧，其条目是另一个数据帧的行之间的关系？

2条回答

网友

1楼 · 编辑于 2024-09-27 09:27:39

IIUC，您可以通过shift()对组和dropna执行此操作：

df.sort_values('sequence', inplace=True)
df['elementID_1'] = df.groupby('groupID').elementID.shift()
df.dropna()

输出：

+  +      -+     -+      +       -+
|    | elementID   | groupID   |   sequence | elementID_1   |
|  +      -+     -+      +       -|
|  1 | dcv         | A         |          1 | abc           |
|  2 | asd         | B         |          3 | ccc           |
|  4 | abc         | B         |          4 | asd           |
+  +      -+     -+      +       -+

然后可以删除sequence列并将elementID重命名为elementID_2

网友

2楼 · 编辑于 2024-09-27 09:27:39

这里有一种使用groupby+itertools的方法

s=df.groupby('groupID').elementID.apply(lambda x : set(itertools.combinations(x.values.tolist(), 2)))
df1=pd.DataFrame(s.index.repeat(s.str.len()))
df2=pd.DataFrame(list(itertools.chain(*s.tolist())))
pd.concat([df1,df2],axis=1)
Out[286]: 
  groupID    0    1
0       A  abc  dcv
1       B  asd  abc
2       B  asd  ccc
3       B  ccc  abc

相关问题更多 >

编程相关推荐

热门问题

热门文章

创建一个数据帧，其条目是另一个数据帧的行之间的关系？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >