计算二部图的投影需要大量时间

2024-09-27 07:21:24 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在使用这个数据集:https://www.kaggle.com/rdoume/beerreviews 它有150万行。 我正在使用Networkx创建一个图形,如下所示:

beerid_series = beer_reviews['beer_beerid']
profilename_series = beer_reviews['review_profilename']
beer_review_edges = [(row["beer_beerid"],row["review_profilename"]) for 
idx,row in beer_reviews.iterrows()]
BeerGraph = nx.Graph()
BeerGraph.add_nodes_from(beerid_series,bipartite=0)
BeerGraph.add_nodes_from(profilename_series,bipartite=1)
BeerGraph.add_edges_from(beer_review_edges)

为了创建投影图,我正在这样做:

Beer_Projected_G = bipartite.projected_graph(BeerGraph, beerid_series)

要创建这个投影图,需要花费大量的时间。我的代码实现有什么问题吗,或者我必须做些什么来提高计算速度

谢谢


Tags: 数据fromaddreviewrowseriesnodesreviews

热门问题