在Python3.5中尝试使程序多线程失败

from fuzzywuzzy import process, fuzz import ast def people(email): #Checking the names of people with fuzzywuzzy library of python return([returns result]) writel = open (r'output.csv','w',encoding='utf-8',errors='ignore') with open ('emailfile.txt','r',encoding='ascii',errors='ignore') as Filepointer: result = [] for line in Filepointer.readlines(): count += 1 data = people(line.strip()) if data is not "": result.append(data) for data in result: writel.write(str(data) + "\n") writel.close()

from fuzzywuzzy import process, fuzz import ast from concurrent.futures import ThreadPoolExecutor import threading global FinalOutput def people(email): #Checking the names of people with fuzzywuzzy library of python FinalOutput.append([appends returned result]) print (FinalOutput) return threads = [] writel = open (r'output.csv','w',encoding='utf-8',errors='ignore') count = 0 pool = ThreadPoolExecutor(max_workers=10) with open ('emailfile.txt','r',encoding='ascii',errors='ignore') as Filepointer: for line in Filepointer.readlines(): pool.submit(people,line.strip()) pool.shutdown(wait=True) for data in FinalOutput: writel.write(str(data) + "\n") writel.close()

1条回答

网友

1楼 · 发布于 2024-09-29 23:30:05

Python有一个很棒的并行化工具，叫做多处理池。它不是多线程，而是并行化，这似乎是您的意图。我们要做的是使people返回一个值，而不是将结果附加到全局变量：

def people(email):
    # This is where the magic happens
    return result

从那里我们可以创建一个Pool并调用它的map函数，该函数自动分配iterable返回的值，并按它们在iterable中的顺序在列表中返回：

from multiprocessing import Pool

with open(r'output.csv','w',encoding='utf-8',errors='ignore') as FilePointer:
    with Pool() as pool:
        FinalOutput = pool.map(people, FilePointer.readlines())

with open(r'output.csv', 'w', encoding='utf-8', errors='ignore') as writel:
    for data in FinalOutput:
        writel.write(str(data) + '\n')

您还可以研究一个名为joblib的包，它有一个函数，可以以更整洁、更灵活的方式实现这一点

相关问题更多 >

编程相关推荐

热门问题

热门文章