Python脚本中的多线程技术

# Code for generating D1 ... # Code for generating D2 ... # Code for generating D3 ... # Code for generating D4 ... # P starts F1 = csv.reader(open('data/F1.csv'), delimiter='\t') F2 = open('data/F2.csv', 'wb') for row in F1: toBeWritten = { ... some read operations on Di ... } #detailed code is given below in Edit 2 F2.write(toBeWritten) # P ends

# D1 is a 1.5M x 1.3M sparse matrix, read as scipy.sparse.lil_matrix. # D2 is a 1.5M x 111 matrix, read as numpy.array # for row in F1: user_id = row[0] clust = D2[user_id, 110] neighbors = D2[ D2[:, 110] == clust][:,1] score = np.zeros(1300000) for neigh in neighbors: score = score + D1 [neigh, :] # the most expensive operation toBeWritten = np.argsort(score)[:,::-1].A[0,:]

1条回答

网友

1楼 · 发布于 2024-09-30 14:28:14

不确定线程是否可以帮助您解决特定的问题，但您可以这样做：

# Code for generating D1
  ...
# Code for generating D2
  ...
# Code for generating D3
  ...
# Code for generating D4
  ...

# P starts

with open('data/F1.csv', 'rb') as csv_file, open('data/F2.csv', 'wb') as F2:
    F1 = csv.reader(csv_file, delimiter='\t')
    result = list()

    def do_work(lines):
        for line in lines:
            toBeWritten = { ... some read operations on Di ... }
            result.append(toBeWritten)

    data = list(F1)
    t0 = threading.Thread(target=do_work, args=(data[:len(data)/2], ))
    t1 = threading.Thread(target=do_work, args=(data[len(data)/2:], ))
    t0.start()
    t1.start()
    t0.join()
    t1.join()

    for line in result:
        F2.write(line)

# P ends

如果线程没有帮助，您可能需要尝试多处理。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章