如何在python中用多线程打开Post-url

rescodeinvalid =[] success = [] for i in range(0,len(HostArray)): data = urllib.urlencode(post_data) req = urllib2.Request(HostArray[i], data) response = urllib2.urlopen(req) rescode=response.getcode() if responsecode == 400: rescodeinvalid.append(HostArray[i]) if responsecode == 200: success.append(HostArray[i])

0条回答

网友

1楼 · 发布于 2024-05-19 11:03:12

您的案例（基本上是将一个列表处理成另一个列表）看起来像是concurrent.futures的理想候选者（参见示例this answer），或者您可以一直到^{}。当然，使用ThreadPoolExecutor将并发运行的线程数限制在合理的范围内。在

网友

2楼 · 发布于 2024-05-19 11:03:12

如果你想在一个单独的线程中完成每一个任务，你可以做如下操作：

  rescodeinvalid =[]
  success = []

  def post_and_handle(url,post_data)
       data = urllib.urlencode(post_data)
       req = urllib2.Request(url, data)
       response = urllib2.urlopen(req)
       rescode=response.getcode()

       if responsecode == 400:
              rescodeinvalid.append(url) # Append is thread safe
       elif responsecode == 200:
              success.append(url)  # Append is thread safe

  workers = []
  for i in range(0,len(HostArray)):
         t = threading.Thread(target=post_and_handle,args=(HostArray[i],post_data))
         t.start()
         workers.append(t)

  # Wait for all of the requests to complete
  for t in workers:
       t.join()

我还建议使用请求：http://docs.python-requests.org/en/latest/

以及线程池： Threading pool similar to the multiprocessing Pool?

线程池使用率：

^{pr2}$

网友

3楼 · 发布于 2024-05-19 11:03:12

scrapy使用twisted library并行调用多个url，而无需为每个请求打开一个新线程的开销，它还可以管理内部队列以累积甚至优先化它们作为奖励您还可以通过设置限制并行请求的数量maximum concurrent requests，您可以启动一个废弃的spider作为外部进程，也可以从代码中启动，只需设置spider start_urls = HostArray

相关问题更多 >

编程相关推荐

热门问题

热门文章