PandasDF中的群连通图

2024-09-29 02:24:07 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个pandas DF,其中每列表示一个节点,两列表示一个边,如下所示:

 import pandas as pd
df = pd.DataFrame({'node1': ['2', '4','17', '17', '205', '208'],
               'node2': ['4', '13', '25', '38', '208', '300']})

所有节点都是无向的,即您可以从一个节点到另一个节点undirected_graph

我想将它们分成所有相连的组(Connectivity),如下所示:

^{pr2}$

例如,前两行之所以被分组,是因为可以从节点2到节点13(到4)。在

我找到的最接近的问题是: pandas - reshape dataframe to edge list according to column values但据我所知,这是一个不同的问题。在

在这方面的任何帮助都会很好,谢谢。在


Tags: toimportdataframepandasdf节点asgraph
2条回答

如果由于某种原因不能使用外部库,则可以实现以下算法:

import pandas as pd


def bfs(graph, start):
    visited, queue = set(), [start]
    while queue:
        vertex = queue.pop(0)
        if vertex not in visited:
            visited.add(vertex)
            queue.extend(graph[vertex] - visited)
    return visited


def connected_components(G):
    seen = set()
    for v in G:
        if v not in seen:
            c = set(bfs(G, v))
            yield c
            seen.update(c)


def graph(edge_list):
    result = {}
    for source, target in edge_list:
        result.setdefault(source, set()).add(target)
        result.setdefault(target, set()).add(source)
    return result


df = pd.DataFrame({'node1': ['2', '4', '17', '17', '205', '208'],
                   'node2': ['4', '13', '25', '38', '208', '300']})

G = graph(df[['node1', 'node2']].values)
components = connected_components(G)
lookup = {i: component for i, component in enumerate(components, 1)}
df['group'] = [label for node in df.node1 for label, component in lookup.items() if node in component]
print(df)

输出

^{pr2}$

使用networkxconnected_components

import networkx as nx

G=nx.from_pandas_edgelist(df, 'node1', 'node2')

l=list(nx.connected_components(G))

L=[dict.fromkeys(y,x) for x, y in enumerate(l)]

d={k: v for d in L for k, v in d.items()}

#df['New']=df.node1.map(d)
df.node1.map(d)
0    0
1    0
2    1
3    1
4    2
5    2
Name: node1, dtype: int64

相关问题 更多 >