Python中for循环的多处理或线程化

2024-10-02 18:23:07 发布

您现在位置:Python中文网/ 问答频道 /正文

我目前正在做一个需要帮助的项目。我正在研究一些大型图,这些图需要多年来获得它们的一些性质。我正在考虑使用Python的多处理或线程包。我有一个for循环,每年循环一次,生成一个csv。我不知道我怎样才能把它并行化,你能帮我吗? 这是我的密码:

for year in tqdm(years):
    
    temp_df = df[df.label <= year]
    processed_df = id_df.copy()
    G = nx.DiGraph()
    G.add_edges_from(temp_df.iloc[:,:2].values.tolist())
    
    # Degree Centrality
    DegreeCentrality = degree_centrality(G)
    DegreeCentrality_df = pd.DataFrame(DegreeCentrality.items(), columns=['id', 'DegreeCentrality'])
    processed_df = pd.merge(processed_df, DegreeCentrality_df, how='left', on='id').fillna(0)
    
    del DegreeCentrality
    del DegreeCentrality_df
    gc.collect()
    
    # In Degree Centrality
    InDegreeCentrality = in_degree_centrality(G)
    InDegreeCentrality_df = pd.DataFrame(InDegreeCentrality.items(), columns=['id', 'InDegreeCentrality'])
    processed_df = pd.merge(processed_df, InDegreeCentrality_df, how='left', on='id').fillna(0)
    
    del InDegreeCentrality
    del InDegreeCentrality_df
    gc.collect()

   processed_df.to_csv('properties_{}'.format(year), index=False)

我的猜测是,我应该将for循环中的所有内容都作为一个函数,并为不同的线程调用它。任何帮助都将不胜感激,谢谢


Tags: csviniddffor线程yeartemp