正在尝试将文件下载缓冲区拆分为单独的线程问题的回答

正在尝试将文件下载缓冲区拆分为单独的线程

回答此问题可获得 20 贡献值，回答如果被采纳可获得 50 分。

0 条评论
分类：Python问答

默认排序时间排序

1 个回答

匿名 1天前

　擅长：python、mysql、java

<p>这是这个项目的另一个版本。差异：</p> <ul> <li><p>线程代码是一个单一的小函数</p></li> <li><p>每个线程下载一个块，然后将其存储在全局线程安全字典中</p></li> <li><p>线程被启动，然后<code>join()</code>它们同时运行</p></li> <li><p>所有操作完成后，数据按正确的顺序重新组合，然后写入磁盘</p></li> <li><p>额外打印，以验证所有内容是否正确</p></li> <li><p>计算输出文件大小，以便进行额外比较</p></li> </ul> <h2>来源</h2> <pre><code>import os, requests import threading import urllib2 import time URL = "http://www.nasa.gov/images/content/607800main_kepler1200_1600-1200.jpg" def buildRange(value, numsplits): lst = [] for i in range(numsplits): if i == 0: lst.append('%s-%s' % (i, int(round(1 + i * value/(numsplits*1.0) + value/(numsplits*1.0)-1, 0)))) else: lst.append('%s-%s' % (int(round(1 + i * value/(numsplits*1.0),0)), int(round(1 + i * value/(numsplits*1.0) + value/(numsplits*1.0)-1, 0)))) return lst def main(url=None, splitBy=3): start_time = time.time() if not url: print "Please Enter some url to begin download." return fileName = url.split('/')[-1] sizeInBytes = requests.head(url, headers={'Accept-Encoding': 'identity'}).headers.get('content-length', None) print "%s bytes to download." % sizeInBytes if not sizeInBytes: print "Size cannot be determined." return dataDict = {} # split total num bytes into ranges ranges = buildRange(int(sizeInBytes), splitBy) def downloadChunk(idx, irange): req = urllib2.Request(url) req.headers['Range'] = 'bytes={}'.format(irange) dataDict[idx] = urllib2.urlopen(req).read() # create one downloading thread per chunk downloaders = [ threading.Thread( target=downloadChunk, args=(idx, irange), ) for idx,irange in enumerate(ranges) ] # start threads, let run in parallel, wait for all to finish for th in downloaders: th.start() for th in downloaders: th.join() print 'done: got {} chunks, total {} bytes'.format( len(dataDict), sum( ( len(chunk) for chunk in dataDict.values() ) ) ) print " - %s seconds -" % str(time.time() - start_time) if os.path.exists(fileName): os.remove(fileName) # reassemble file in correct order with open(fileName, 'w') as fh: for _idx,chunk in sorted(dataDict.iteritems()): fh.write(chunk) print "Finished Writing file %s" % fileName print 'file size {} bytes'.format(os.path.getsize(fileName)) if __name__ == '__main__': main(URL) </code></pre> <h2>输出</h2> ^{pr2}$

正在尝试将文件下载缓冲区拆分为单独的线程

1 个回答

相关Python问题