如何使用线程来解析Python中的多个网页？

import threading from selenium import webdriver def parse_page(page_url): driver = webdriver.PhantomJS() driver.get(url) text = driver.page_source .......... return parsed_items def threader(): worker = q.get() parse_page(page_url) q.task_one() urls = [.......] q = Queue() for x in range(len(urls)): t = threading.Thread(target=threader) t.daemon = True t.start() for worker in range(20): q.put(worker) q.join()

1条回答

网友

1楼 · 发布于 2024-06-25 06:09:38

可能最简单的方法是使用ThreadPool来自multiprocessing.pool模块，或者如果您使用的是python3 ThreadPoolExecutor来自{}模块。在

ThreadPool具有（几乎）与常规的Pool相同的api，但使用线程而不是进程。在

例如

def f(i):
    return i * i

from multiprocessing.pool import ThreadPool
pool = ThreadPool(processes=10)
res = pool.map(f, [2, 3, 4, 5])
print(res)
[4, 9, 16, 25]

对于ThreadPoolExecutor，请检查example。在

编程相关推荐

jsoup有效文件路径抛出java。木卫一。FileNotFoundException
java如何在不删除和添加Mapbox中的层的情况下更改SymbolLayer的Z值？
java计算用户定义年数内四个季度的降雨量
如何在Java中轻松地将格式为“20 0F 01”的字符串更改为十六进制值？
java在JPA或Hibernate中“持久类”和“实体”之间有什么区别？
java Android:AlarmManager“缺少对unregisterReceiver（）的调用？”当按下后退按钮时
logcat中的java错误“isDataSchedulerEnabled（）：false”
java i/p col特性必须是字符串或数字类型，但不能是org。阿帕奇。火花利纳格小姐。向量
java如何从Post请求url和浏览器转储中隐藏密码
多线程javamail中的java问题

相关问题更多 >

编程相关推荐

热门问题

热门文章