Python/Multiprocessing：进程似乎不是

def fileToRNAString(_file): if (_file and os.path.isfile(_file)): rnaSequences = [] blockCount = 0 blockSize = 2048 printAndLog("!", "Converting %s into RNA string (%d bytes/block)" % (_file, blockSize)) with open(_file, "rb") as hFile: buf = hFile.read(blockSize) while buf: decSequenceToRNA(blockCount, buf, rnaSequences) blockCount = blockCount + 1 buf = hFile.read(blockSize) else: printAndLog("-", "Could not find the specified file. Please verify that the file exists:" + _file) return rnaSequences

def decSequenceToRNA(_idxSeq, _byteSequence, _rnaSequences): rnaSequence = '' printAndLog("!", "Processing block %d (%d bytes)" % (_idxSeq, len(_byteSequence))) for b in _byteSequence: rnaSequence = rnaSequence + base10ToRNA(ord(b)) printAndLog("+", "Block %d completed. RNA of %d nucleotides generated." % (_idxSeq, len(rnaSequence))) _rnaSequences.append((_idxSeq, rnaSequence))

2条回答

网友

1楼 · 编辑于 2024-10-03 19:32:27

试着写这个（参数列表末尾的逗号）

p = Process(target=decSequenceToRNA, args=(blockCount, buf, rnaSequences,))

网友

2楼 · 编辑于 2024-10-03 19:32:27

decSequenceToRNA在它自己的进程中运行，这意味着它在主进程中获得每个数据结构的独立副本。这意味着当您在decSequenceToRNA中追加_rnaSequences时，它对父进程中的rnaSequences没有任何影响。这就解释了为什么返回一个空列表。在

你有两个选择来解决这个问题。首先，创建一个^{}，它可以使用multiprocessing.Manager在进程之间共享。例如：

import multiprocessing

def f(shared_list):
    shared_list.append(1)

if __name__ == "__main__":
    normal_list = []
    p = multiprocessing.Process(target=f, args=(normal_list,))
    p.start()
    p.join()
    print(normal_list)

    m = multiprocessing.Manager()
    shared_list = m.list()
    p = multiprocessing.Process(target=f, args=(shared_list,))
    p.start()
    p.join()
    print(shared_list)

输出：

^{pr2}$

将此应用于代码只需替换

rnaSequences = []

与

m = multiprocessing.Manager()
rnaSequences = m.list()

或者，您可以（也可能应该）使用^{}，而不是为每个块创建单独的Process。我不确定hFile有多大，或者您正在读取的块有多大，但是如果有超过^{}块，那么您将因为为每个块生成进程而损害性能。使用Pool，您可以保持进程计数不变，并轻松创建rnaSequence列表：

def decSequenceToRNA(_idxSeq, _byteSequence):
    rnaSequence = ''
    printAndLog("!", "Processing block %d (%d bytes)" % (_idxSeq, len(_byteSequence)))
    for b in _byteSequence:
        rnaSequence = rnaSequence + base10ToRNA(ord(b))
    printAndLog("+", "Block %d completed. RNA of %d nucleotides generated." % (_idxSeq, len(rnaSequence)))
    return _idxSeq, rnaSequence

def fileToRNAString(_file):
    rnaSequences = []
    if (_file and os.path.isfile(_file)):
        blockCount = 0
        blockSize = 2048
        printAndLog("!", "Converting %s into RNA string (%d bytes/block)" % (_file, blockSize))
        results = []
        p = multiprocessing.Pool()  # Creates a pool of cpu_count() processes
        with open(_file, "rb") as hFile:
            buf = hFile.read(blockSize)
            while buf:
                result = pool.apply_async(decSequenceToRNA, blockCount, buf)
                results.append(result)
                blockCount = blockCount + 1
                buf = hFile.read(blockSize)
        rnaSequences = [r.get() for r in results]
        pool.close()
        pool.join()
    else:
        printAndLog("-", "Could not find the specified file. Please verify that the file exists:" + _file)
    return rnaSequences

请注意，我们不再将rnaSequences列表传递给孩子。相反，我们只需将返回的结果返回给父对象（我们不能使用Process），并在那里构建列表。在

相关问题更多 >

编程相关推荐

热门问题

热门文章